InternalAuditInterprise/2-task-AIAudit.md

# 2-task-AIAudit · 开发任务文档

> 项目：基于本地私有化大模型的电信运营商 AI 全域内审平台（AIAudit）
> 版本：v0.1（待评审）
> 日期：2026-06
> 上游来源：`0-req-AIAudit.md`、`1-prd-AIAudit.md`

---

## 使用说明

- 任务以可勾选清单组织：`- [ ]` 未开始 / `- [x]` 已完成 / `- [~]` 进行中。
- 编号规则：`P{阶段}.{模块}.{任务}`，子任务再加一级。
- 每个任务标注：**目标**、**映射**（需求 R / PRD 功能）、**验收标准（DoD）**、**依赖**。
- 阶段：**MVP**（一期）/ **二期** / **三期**。优先级沿用 PRD 的 MoSCoW。
- 开发过程中本文档持续更新（勾选、记录变更、补充新任务）。

### 进度总览
| 阶段 | 模块数 | 状态 |
| --- | --- | --- |
| P0 项目基建与选型 | 4 | 进行中（P0.1 完成，P0.2/P0.3 部分） |
| P1 MVP（数据中台+引擎+R8/R9+闭环+自审计+看板+盲测） | 11 | 进行中（P1.2 大部完成，P1.3 部分） |
| P2 二期（规则进化+R10/R11/R15+热力图+反馈学习+运营看板） | 6 | 未开始 |
| P3 三期（R12/R13/R14+近实时+信创+规则库规模化） | 5 | 未开始 |

---

# P0 · 项目基建与技术选型（MVP 前置）

## P0.1 技术选型与架构基线
> 目标：确定技术栈与总体架构，形成可执行的工程基线。映射：PRD §1.2、非功能全量。依赖：无。

- [x] P0.1.1 召开技术选型评审，确定后端框架、前端框架、关系库、图数据库、时序/双时态存储、向量库、LLM 推理框架、任务调度组件
  - 验收：产出《技术选型决策记录(ADR)》，每项含选型理由与备选；信创适配可行性结论
  - 完成：见 `docs/adr/ADR-0001-tech-stack.md`
- [ ] P0.1.2 绘制总体架构图（应用层/引擎层/数据中台层/模型层/算力层/安全自审计层）
  - 验收：架构图 + 组件职责说明评审通过，明确内网闭环边界与数据零出域边界
- [x] P0.1.3 定义模块划分与代码仓库结构（monorepo 或多仓）、分支与发布策略
  - 验收：仓库初始化完成，README 含目录约定与协作规范
  - 完成：monorepo 结构（backend/frontend/infra/docs），`README.md`、`.gitignore` 已建
- [x] P0.1.4 定义数据零出域的网络与部署约束基线（内网隔离、出域阻断、无外网依赖清单）
  - 验收：约束清单评审通过，CI 中加入"禁止外网依赖"检查项
  - 完成：ADR 定义红线；代码层 prod 禁用公网 Provider（`app/config.py`、`app/llm/factory.py`），已有测试覆盖；CI 校验待 P0.3.2

## P0.2 开发与运行环境
> 目标：搭建可复现的开发/测试环境。映射：非功能 5.1/5.2。依赖：P0.1。

- [ ] P0.2.1 本地化依赖与离线包源（内网制品库/镜像），避免外网拉取
  - 验收：在隔离网络中可完成依赖安装与构建
  - 进展：已配置清华镜像源加速开发期安装（`~/.config/pip/pip.conf`）；内网制品库待部署
- [x] P0.2.2 容器化与编排（开发/测试环境一键拉起）→ 调整为本地安装
  - 验收：本地 PostgreSQL 16 可用，初始化脚本可建库建扩展
  - 完成：**弃用 Docker**（已删除 docker-compose/Dockerfile）。本机 Homebrew 安装 PostgreSQL 16.14 + pgvector 0.8 + btree_gist；`infra/postgres/setup_local.sh` 建库建扩展通过。TimescaleDB 因 macOS 编译问题本地跳过（迁移条件执行，生产 Linux 启用），见 ADR-0002
- [ ] P0.2.3 GPU 推理环境准备（驱动、推理框架、显存配置）
  - 验收：可在本地 GPU 上加载一个基线模型并完成一次推理

## P0.3 工程质量基线
> 目标：建立测试、CI、代码规范。映射：阶段 5 通用约束。依赖：P0.1。

- [x] P0.3.1 单元/集成测试框架与覆盖率门槛
  - 验收：示例测试可运行，CI 跑测试并产出覆盖率报告
  - 完成：pytest 接入，7 个测试通过（含数据零出域红线测试）；覆盖率门槛与 CI 集成待 P0.3.2
- [ ] P0.3.2 CI 流水线（构建+测试+静态检查+无外网依赖校验）
  - 验收：提交触发流水线，失败可阻断合并
  - 进展：ruff 已接入并通过（`pyproject.toml`），CI 流水线脚本待编写
- [ ] P0.3.3 代码规范、提交规范与 Lint
  - 验收：Lint 接入 CI，违规阻断

## P0.4 安全与权限基线（贯穿）
> 目标：先立"独立性"地基。映射：R19、非功能 5.1。依赖：P0.1。

- [ ] P0.4.1 统一鉴权与 RBAC 模型设计（角色：审计员/主管/规则管理员/系统管理员/系统审计员/业务方）
  - 验收：RBAC 模型评审通过，覆盖 PRD §6 权限矩阵
- [ ] P0.4.2 不可篡改操作日志（审计轨迹）基础设施
  - 验收：任意关键操作落不可篡改日志，含操作人/时间/对象/动作，可查询
- [ ] P0.4.3 敏感数据访问控制与脱敏策略
  - 验收：敏感字段访问受控并可脱敏展示，越权访问被拒并留痕

---

# P1 · MVP（一期）

## P1.1 审计数据中台 · 接入层
> 目标：把多源异构数据汇入审计专用底座。映射：R1 / PRD §4.1。依赖：P0。

- [ ] P1.1.1 接入适配框架（接口/数据库/文件三类），插件式数据源注册
  - 验收：可注册一个新数据源并完成一次导入，不改源系统
- [ ] P1.1.2 数据源接入配置（连接、字段映射、同步周期）管理界面/配置
  - 验收：通过配置即可接入，无需改代码；配置项可校验
- [ ] P1.1.3 全量初始化导入 + 失败告警与隔离
  - 验收：单源失败记录原因并告警，不影响其他源；可重试
- [ ] P1.1.4 接入侧数据零出域校验
  - 验收：接入过程无任何外网传输，校验项纳入测试
- [ ] P1.1.5 样例/脱敏数据集导入（用于开发与盲测）
  - 验收：可一键导入样例数据，覆盖 R8/R9 所需字段

## P1.2 审计数据中台 · 本体层与知识图谱
> 目标：按审计本体组织实体与关系。映射：R2 / PRD §4.1。依赖：P1.1。

- [x] P1.2.1 审计本体(Ontology)定义（客户/合同/号码/IMEI/账户/工单/供应商/结算单及关系）
  - 验收：本体 schema 评审通过，含实体属性与关系定义
  - 完成：`app/datahub/ontology.py`（12 实体类型 + 12 关系类型 + 本体域约束），见 ADR-0002；单元测试覆盖
- [x] P1.2.2 知识图谱存储与建模落地
  - 验收：实体与关系写入图存储，可做多跳关联查询
  - 完成：关系表 `entity`/`entity_relationship` + 递归 CTE 多跳穿透（`app/datahub/graph_repo.py`），集成测试验证"实控人识别"
- [x] P1.2.3 主数据对齐（跨系统实体统一识别与关联）
  - 验收：对齐结果可验证（如同一实控人聚合），对齐失败显式标记
  - 完成：`entity` 以 (类型,业务主键) 幂等归一 + `canonical_id` 归并锚点；穿透识别同一实控人已测
- [ ] P1.2.4 数据清洗与质量评分（缺失/重复/口径不一致探查）
  - 验收：质量评分可在界面查看；关键字段缺失/无法对齐标记人工干预而非丢弃
- [x] P1.2.5 统一穿透/图谱查询服务（对引擎与场景提供共同入口）
  - 验收：提供统一查询 API，支持关联穿透；返回结果可解释来源
  - 完成：`app/api/datahub.py`（`POST /datahub/penetrate` 多跳穿透 + `GET /datahub/entities/{id}`），返回带最短跳数的关联实体；API 集成测试通过

## P1.3 审计数据中台 · 时态层
> 目标：原生支持时间维度与版本回溯。映射：R3 / PRD §4.1。依赖：P1.1。

- [x] P1.3.1 双时态建模（业务发生时间 + 系统记录时间）
  - 验收：可按任意历史时点回放数据状态，回放结果正确
  - 完成：`BitemporalFact` + `bitemporal_repo.as_of()` 回放；`btree_gist` 排他约束防有效期重叠；集成测试通过
- [ ] P1.3.2 关键对象时间序列建模（用户生命周期/回款/话务/佣金/资源使用）
  - 验收：可按对象取出有序时间序列，供时序分析
  - 进展：`metric_event` 表已建（生产转 TimescaleDB 超表），时序查询封装待补
- [ ] P1.3.3 增量同步与数据版本记录
  - 验收：每次同步记录时间戳/数据量/数据版本；结论可回溯到数据版本
  - 进展：`data_version` 表已建并被各表外键引用，同步流程待实现
- [ ] P1.3.4 常态化重算触发（增量到达触发相关规则重算）
  - 验收：增量到达后相关场景结果自动更新

## P1.4 本地私有化 LLM 引擎
> 目标：本地部署模型并支持自然语言能力。映射：R4 / PRD §4.2。依赖：P0.2.3。

- [ ] P1.4.1 本地模型部署（千问 70B / DeepSeek 之一）与推理服务封装
  - 验收：内网可用、推理不依赖外网；提供统一推理 API
- [ ] P1.4.2 自然语言查数（NL→查询）能力，对接统一穿透查询服务
  - 验收：审计员自然语言提问返回结构化结果，无需写 SQL
- [ ] P1.4.3 异常模式推理、报告生成、线索解释能力接入
  - 验收：能对给定异常聚类输出"人话"解释与结构化报告
- [ ] P1.4.4 模型版本记录与结论可回溯
  - 验收：每条结论可回溯到模型版本
- [ ] P1.4.5 LLM 输出防幻觉约束（强制附证据/可溯源，不可编造数据）
  - 验收：无证据支撑的结论被拦截或标注低置信

## P1.5 全量穿透引擎
> 目标：全量扫描与跨系统关联穿透。映射：R5 / PRD §4.2。依赖：P1.2、P1.3。

- [ ] P1.5.1 全量扫描任务框架（异步任务、进度反馈、可中断）
  - 验收：长耗时全量任务异步执行并反馈进度
- [ ] P1.5.2 跨系统关联穿透（合同—回款—工商—账户等）
  - 验收：可输出关联路径与证据，覆盖 R8 所需穿透
- [ ] P1.5.3 扫描覆盖范围与数据量输出（证明全量性）
  - 验收：任务结束输出覆盖范围与数据量统计
- [ ] P1.5.4 数据就地分析、数据不出域
  - 验收：穿透过程数据不离开内网，校验纳入测试

## P1.6 线索驱动引擎
> 目标：生成线索+证据链+解释并推送。映射：R7、R18(基础) / PRD §4.2。依赖：P1.4、P1.5。

- [ ] P1.6.1 线索数据模型（风险域/场景/置信度/证据链/判定理由/状态）
  - 验收：线索结构可承载证据链与状态流转
- [ ] P1.6.2 线索生成（由穿透/规则命中产出异常聚类→线索）
  - 验收：异常聚类自动转为线索并附证据链与理由
- [ ] P1.6.3 置信度三级分流（高/中/低）与价值排序
  - 验收：线索分级正确；高置信优先推送
- [ ] P1.6.4 线索推送至审计员工作台
  - 验收：对应审计员可在工作台收到线索

## P1.7 场景一 · 政企收入全链路穿透（R8）
> 目标：识别拆单规避与虚假回款。映射：R8 / PRD §4.3 Must。依赖：P1.5、P1.6。

- [ ] P1.7.1 政企合同全链路建模（立项→审批→报价→签约→开票→回款）
  - 验收：链路数据可端到端串联查询
- [ ] P1.7.2 拆单识别（金额阈值边缘分布检测）
  - 验收：阈值边缘集中分布合同被识别为疑似拆单并生成线索
- [ ] P1.7.3 工商关联穿透（隐性实控人：地址/法人亲属/付款账户同源）
  - 验收：同源关联客户被聚合识别，附证据
- [ ] P1.7.4 回款时序聚类（批量违约/长期挂账）
  - 验收：批量违约模式被识别并生成线索
- [ ] P1.7.5 一键生成《政企客户回款异常专项线索清单》
  - 验收：可导出结构化清单，含证据链

## P1.8 场景二 · 养卡骗补识别（R9）
> 目标：识别脉冲新增+规律退订的周期性造假。映射：R9 / PRD §4.3 Must。依赖：P1.3、P1.6。

- [ ] P1.8.1 用户生命周期时序模式识别（脉冲式增长+规律性衰减）
  - 验收：周期性造假模式被识别并生成线索
- [ ] P1.8.2 渠道佣金与业务质量匹配（在网时长/通话/流量活跃度）
  - 验收：佣金与质量不匹配渠道被标记
- [ ] P1.8.3 沉默/零通话/零流量用户批量聚类（含物联网卡虚假激活）
  - 验收：批量沉默用户被聚类识别
- [ ] P1.8.4 项目交付物与收入确认交叉验证
  - 验收：交付与收入不匹配项被识别

## P1.9 人机协同闭环（R17 基础）
> 目标：线索到销项全流程在线留痕。映射：R17 / PRD §4.4 Must。依赖：P1.6。

- [ ] P1.9.1 线索分派（主管→审计员）
  - 验收：可分派并通知；分派留痕
- [ ] P1.9.2 复核研判与定性分类
  - 验收：审计员可研判、定性，记录理由
- [ ] P1.9.3 审计底稿自动生成（可追溯）
  - 验收：研判完成自动生成底稿，含证据链与版本信息
- [ ] P1.9.4 整改/移交与销项复核闭环、状态机
  - 验收：线索状态全流程可跟踪，过程留痕

## P1.10 系统自审计与独立性（R19）
> 目标：让审计系统自身经得起审计。映射：R19 / PRD §4.4 Must、§6。依赖：P0.4。

- [ ] P1.10.1 规则/阈值变更全程留痕（操作人/时间/变更内容）
  - 验收：任意变更可追溯
- [ ] P1.10.2 线索不可删除约束
  - 验收：任何角色删除线索请求被拒并留痕
- [ ] P1.10.3 关键操作分权制衡（配规则/看线索/改阈值/出报告分离）
  - 验收：越权操作被拒，符合 PRD §6 权限矩阵
- [ ] P1.10.4 模型/规则/数据三重版本留痕与回溯
  - 验收：任一结论可回溯到当时的模型、规则、数据版本

## P1.11 应用层、看板与盲测验证
> 目标：审计员零门槛使用 + 盲测证明价值。映射：R20、R21、R18 / PRD §2.2、§7。依赖：P1.6-P1.10。

- [ ] P1.11.1 线索看板（按风险域/场景/置信度筛选与下钻）
  - 验收：看板可筛选下钻，展示证据链
- [ ] P1.11.2 自然语言查询入口（前端）
  - 验收：审计员可自然语言查询并查看结果
- [ ] P1.11.3 智能报告与专项清单导出
  - 验收：可一键生成报告/清单
- [ ] P1.11.4 高置信预警推送
  - 验收：高置信线索触发主动通知
- [ ] P1.11.5 历史数据全量重跑 + 同台盲测
  - 验收：用 2-3 年历史数据重跑，与既有审计结论对比，复现已知线索并发现新增真实线索
- [ ] P1.11.6 同台盲测成效报告
  - 验收：产出成效报告，量化命中率与新增线索价值

---

# P2 · 二期（能力扩展）

## P2.1 规则进化引擎完整化（R6）
> 目标：NL→规则、沙箱验证、版本管理、迭代。映射：R6 / PRD §4.2 Should。依赖：P1.4、P1.5。

- [ ] P2.1.1 自然语言→可执行规则转化
  - 验收：规则管理员用自然语言描述模式即可生成可执行规则
- [ ] P2.1.2 规则沙箱（历史数据验证命中率，未确认不投产）
  - 验收：新规则先沙箱验证，确认前不进生产
- [ ] P2.1.3 规则版本管理（创建人/修改人/时间/变更）
  - 验收：规则版本历史可查可回溯
- [ ] P2.1.4 基于反馈的规则迭代优化
  - 验收：依据审计员反馈可迭代规则
- [ ] P2.1.5 规则库（机构永久资产，可持续增长）
  - 验收：规则可入库、检索、复用

## P2.2 场景三 · 收入成本跨期匹配（R10）
> 目标：识别确认时点错配。映射：R10 / PRD §4.3 Should。依赖：P1.2、P1.3。
- [ ] P2.2.1 收入确认政策/账务/合同三方勾稽
- [ ] P2.2.2 趸交/预收款一次性确认异常分录识别
- [ ] P2.2.3 设备交付与收入确认时间差监控
- [ ] P2.2.4 按使用量计费却提前确认收入识别
  - 验收（本模块）：各类时点错配生成线索并附勾稽证据

## P2.3 场景四 · 渠道佣金与套利（R11）
> 目标：终端流向与佣金匹配。映射：R11 / PRD §4.3 Should。依赖：P1.3。
- [ ] P2.3.1 IMEI 与用户绑定真实性校验
- [ ] P2.3.2 佣金与在网时长匹配度
- [ ] P2.3.3 IMEI 级终端流向追踪（激活即沉默/跨省流通）
- [ ] P2.3.4 代理商业务质量时序衰减分析
  - 验收（本模块）：套利闭环被识别并生成线索

## P2.4 场景八 · 员工内部舞弊（R15）
> 目标：权限滥用与积分套现识别。映射：R15 / PRD §4.3 Should。依赖：P1.2。
- [ ] P2.4.1 员工权限操作日志异常模式识别
- [ ] P2.4.2 内部测试号用途偏离识别
- [ ] P2.4.3 积分/电子券流向追踪与套现识别
- [ ] P2.4.4 权限-岗位匹配度分析（越权识别）
  - 验收（本模块）：内部舞弊模式生成线索并附证据

## P2.5 风险域全景与热力图（R16）
> 目标：全局视图与优先级。映射：R16 / PRD §4.4 Should。依赖：P1.6。
- [ ] P2.5.1 五大风险域归类与场景挂载
- [ ] P2.5.2 风险热力图（概率×金额）
- [ ] P2.5.3 高概率高金额场景配置为全量持续监控
- [ ] P2.5.4 多维筛选与下钻（风险域/场景/地市/单位）
  - 验收（本模块）：热力图可视化 + 一眼看出优先级

## P2.6 误报反馈学习与运营看板（R18、R21）
> 目标：准确率随使用上升 + 成效可量化。映射：R18、R21 / PRD §4.4 Should。依赖：P1.6、P1.11。
- [ ] P2.6.1 审计员"误报/属实"标注与反馈采集
- [ ] P2.6.2 阈值/模型基于反馈持续校准
- [ ] P2.6.3 运营看板（命中率/准确率/线索转化率）
- [ ] P2.6.4 成效度量（可挽回收入/止损统计）
  - 验收（本模块）：反馈闭环生效，运营指标上看板

---

# P3 · 三期（全域覆盖）

## P3.1 场景五 · 网络建设与工程采购（R12）
> 映射：R12 / PRD §4.3 Could。依赖：P1.2、P2.1。
- [ ] P3.1.1 投标关联分析（报价相似度/文件雷同度，NLP 比对）
- [ ] P3.1.2 工程量与资源消耗匹配验证
- [ ] P3.1.3 巡检 GPS 轨迹与工单交叉验证
- [ ] P3.1.4 供应商画像与"马甲"识别
  - 验收（本模块）：围标串标/虚增工程量生成线索

## P3.2 场景六 · 互联互通与网间结算（R13）
> 映射：R13 / PRD §4.3 Could。依赖：P1.3。
- [ ] P3.2.1 话务量时序异常（突发峰值/整数时长聚集）
- [ ] P3.2.2 网间结算与网络侧原始信令比对
- [ ] P3.2.3 SP/CP 业务量与收入结算交叉验证
- [ ] P3.2.4 国际来话真实路由溯源
  - 验收（本模块）：刷量套利生成线索

## P3.3 场景七 · 云业务/IDC（R14）
> 映射：R14 / PRD §4.3 Could。依赖：P1.2、P1.3。
- [ ] P3.3.1 云资源利用率 vs 计费量匹配
- [ ] P3.3.2 IDC 出租率与电力消耗勾稽
- [ ] P3.3.3 新兴业务客户关联方识别与预付模式异常
- [ ] P3.3.4 收入确认与交付验收时序一致性
  - 验收（本模块）：空转/虚租生成线索

## P3.4 增量近实时与常态化（R3 完整）
> 映射：R3 / PRD §7 三期。依赖：P1.3。
- [ ] P3.4.1 从周期增量升级为近实时增量
- [ ] P3.4.2 常态化 7×24 监控调度与告警
  - 验收：近实时数据驱动常态化监控稳定运行

## P3.5 信创适配与规则库规模化
> 映射：非功能 5.6、R6 / PRD §7 三期。依赖：P0.1、P2.1。
- [ ] P3.5.1 国产 GPU 与信创软硬件适配验证
- [ ] P3.5.2 规则库规模化治理（分类/检索/质量/退役）
  - 验收：信创环境跑通 + 规则库可规模化运营

---

## 变更记录
| 日期 | 变更内容 | 责任人 |
| --- | --- | --- |
| 2026-06 | 初版创建 | — |
| 2026-06 | 弃用 Docker，改用本地 PostgreSQL 16（卸载 pg14，装 pg16+pgvector）；数据中台本体/图谱/双时态落地并通过集成测试 | — |

---

> **请检查确认本任务文档。** 确认通过后，将按本文档（建议从 P0 基建开始）推进开发，每完成一组任务进行测试、更新本文档状态并向你汇报。如需调整任务粒度、阶段切分或依赖关系，请直接告诉我。