InternalAuditInterprise/1-prd-AIAudit.md

# 1-prd-AIAudit · 产品需求文档（PRD）

> 项目：基于本地私有化大模型的电信运营商 AI 全域内审平台（AIAudit）
> 版本：v0.1（待评审）
> 日期：2026-06
> 上游来源：`0-req-AIAudit.md`

---

## 1. 产品概述与定位

### 1.1 一句话定位
**AIAudit 是一套建在运营商自己机房、数据零出域、覆盖全业务域、越用越聪明的本地 AI 内审能力体系**——不是一套工具，而是一套可持续进化、归审计独立掌控的审计大脑。

### 1.2 产品形态
- 部署形态：本地私有化部署（内网闭环，数据一比特不出机房）。
- 能力构成：审计专用数据中台（底座）+ 四大引擎（LLM / 全量穿透 / 规则进化 / 线索驱动）+ 人机协同闭环（线索到销项）+ 系统自审计（独立可信）。
- 交付物：本地 AI 审计平台 + 可进化规则库 + 已验证高价值线索 + 同台盲测成效报告。

### 1.3 与现有方式的差异化
| 维度 | 传统抽样审计 | 公有云 AI 审计 | AIAudit（本地） |
| --- | --- | --- | --- |
| 数据范围 | 按金额抽样，查不全 | 全量但数据出域 | 全量且数据不出机房 |
| 合规风险 | 低但能力弱 | 能力强但合规风险高 | 私有化、合规可控 |
| 响应效率 | Excel 翻表 | 实时但依赖外网 | 内网闭环秒级响应 |
| 能力归属 | 经验在人脑 | 能力外部租用 | 本地永久沉淀，越用越聪明 |
| 独立性 | 依赖人工 | 数据送人 | 审计独立掌控、自身可审计 |

---

## 2. 目标与成功指标

### 2.1 业务目标
- 把审计覆盖率从约 5% 提升到接近 100%（全量穿透）。
- 把审计节奏从年度快照升级为 7×24 常态化监控。
- 把审计经验固化为机构永久资产（可进化规则库）。
- 数据出域风险归零，满足国资/运营商/等保最严要求。

### 2.2 成功指标（KPI）
| 指标 | 目标（首期/稳态） | 对应需求 |
| --- | --- | --- |
| 审计覆盖率 | ≥ 95%（全量扫描） | R5 |
| 数据出域事件 | 0 起 | 非功能 5.1、R1 |
| 同台盲测命中率 | 复现既有审计结论 + 发现新增真实线索 | R21 |
| 线索准确率（高置信） | 随反馈学习持续提升 | R18 |
| 线索转化率（线索→属实立案） | 可量化、上看板 | R18、R21 |
| 首批线索产出 | 投产首月 200–500 条 | R7 |
| 可挽回收入/止损 | 年化数千万级（保守） | R21 |
| 查询响应 | 常规查询秒级，全量任务异步反馈进度 | 非功能 5.2 |

### 2.3 非目标（本产品不做）
- 不替代业务系统本身的生产功能。
- 不做面向业务方共享的全行级数据中台。
- 不做需要数据出域的任何云端推理。

---

## 3. 用户画像与核心场景（痛点解法）

### 3.1 用户画像
| 角色 | 画像 | 关键诉求 |
| --- | --- | --- |
| 审计员 | 一线内审，业务熟但不写代码 | 看懂线索、查到证据、处置留痕 |
| 审计主管 | 部门负责人 | 全局掌控、成效可量化、流程合规 |
| 规则管理员 | 资深审计/规则专家 | 自然语言配规则、沙箱验证、版本可控 |
| 系统管理员 | IT 运维 | 接入稳定、权限可控、运行可观测 |
| 系统审计员 | 独立监督岗 | 改动可追溯、线索不可被删被拦 |

### 3.2 核心场景与痛点解法
| 场景 | 痛点 | AIAudit 解法 | 对应需求 |
| --- | --- | --- | --- |
| 政企拆单规避 | 大额拆小额规避三重一大，抽样避开 | 金额阈值边缘分布识别 + 工商关联穿透 + 回款时序聚类 | R8 |
| 养卡骗补 | 脉冲新增+规律退订，藏在时序里 | 用户生命周期时序模式识别 + 佣金质量匹配 | R9 |
| 收入成本跨期错配 | 趸交一次性确认、成本分摊错配 | 政策/账务/合同三方勾稽 + 时点错配识别 | R10 |
| 渠道套利套机 | 虚假放号、套卡、异地窜货 | IMEI 级流向追踪 + 佣金在网时长匹配 | R11 |
| 围标串标 | 报价雷同、马甲供应商、虚增工程量 | 投标关联分析 + 巡检轨迹交叉验证 + 供应商画像 | R12 |
| 网间结算刷量 | 话务/短信刷量套结算 | 整数时长识别 + 信令比对 + 到达率交叉验证 | R13 |
| 云空转/IDC虚租 | 资源闲置却全额确认收入 | 利用率vs计费量比对 + 电力勾稽 + 关联方识别 | R14 |
| 内部舞弊 | 内部号套利、越权、积分套现 | 操作日志异常 + 权限岗位匹配 + 积分流向追踪 | R15 |

> 共性痛点："数据涉密不能出域 + 海量单据查不过来 + 时序造假抽样抓不到"。共性解法："本地 LLM + 审计数据中台全量穿透 + 规则进化 + 人机闭环"。

---

## 4. 功能清单与优先级（MoSCoW）

> 优先级：Must（一期 MVP 必须）/ Should（二期）/ Could（三期）/ Won't（暂不做）。映射回 `0-req-AIAudit.md` 需求编号。

### 4.1 数据中台与底座
| 功能 | 优先级 | 需求映射 |
| --- | --- | --- |
| 多源异构数据接入（接口/库/文件） | Must | R1 |
| 审计专用数据底座（物理隔离、独立掌控） | Must | R2 |
| 本体建模与审计知识图谱 | Must | R2 |
| 主数据对齐与数据清洗/质量评分 | Must | R2 |
| 双时态/时序建模与版本回溯 | Must | R3 |
| 增量同步与常态化重算 | Should | R3 |
| 统一穿透/图谱查询服务 | Must | R2 |

### 4.2 核心引擎
| 功能 | 优先级 | 需求映射 |
| --- | --- | --- |
| 本地私有化 LLM 部署与推理 | Must | R4 |
| 自然语言查数（不写 SQL） | Must | R4、R20 |
| 全量穿透扫描引擎 | Must | R5 |
| 跨系统关联穿透 | Must | R5、R2 |
| 规则进化引擎（NL→规则） | Should | R6 |
| 规则沙箱验证与版本管理 | Should | R6 |
| 线索生成 + 证据链 + 人话解释 | Must | R7 |
| 线索价值排序与推送 | Must | R7、R20 |

### 4.3 审计场景
| 功能 | 优先级 | 需求映射 |
| --- | --- | --- |
| 场景一 政企收入全链路穿透 | Must | R8 |
| 场景二 养卡骗补识别 | Must | R9 |
| 场景三 收入成本跨期匹配 | Should | R10 |
| 场景四 渠道佣金与套利 | Should | R11 |
| 场景五 网络建设与工程采购 | Could | R12 |
| 场景六 互联互通与网间结算 | Could | R13 |
| 场景七 云业务/IDC | Could | R14 |
| 场景八 员工内部舞弊 | Should | R15 |

> 一期场景优先级建议：选取"高概率×高金额"的政企拆单（R8）与养卡骗补（R9）作为 MVP 跑通，其余按风险热力图分期接入。最终优先级以评审为准。

### 4.4 闭环、治理与应用
| 功能 | 优先级 | 需求映射 |
| --- | --- | --- |
| 风险域全景与热力图 | Should | R16 |
| 线索分派→研判→定性→整改→销项闭环 | Must | R17 |
| 审计底稿自动生成 | Should | R17 |
| 置信度三级分流 | Must | R18 |
| 误报反馈学习闭环 | Should | R18 |
| 运营指标看板（命中率/准确率/转化率） | Should | R18、R21 |
| 系统自审计（留痕/分权/三重版本/线索不可删） | Must | R19 |
| 线索看板/智能报告/预警推送 | Must | R20 |
| 成效度量与同台盲测报告 | Should | R21 |

---

## 5. 关键流程

### 5.1 数据流（从接入到可分析）
```
源系统(BSS/OSS/ERP/财务/合同/工单/信令)
  → 接入适配(接口/库/文件)
  → 审计数据中台：清洗/质量评分 → 本体建模/主数据对齐(知识图谱) → 双时态/时序建模
  → 统一穿透查询服务
  → 全量穿透引擎 + 本地 LLM
```

### 5.2 审计闭环（从线索到销项）
```
全量扫描/规则命中 → 生成线索+证据链+判定理由(置信度分级)
  → 推送/分派审计员 → 复核研判 → 定性分类
  → 自动生成审计底稿 → 整改 或 移交
  → 销项复核闭环（全程留痕）
  → 审计员反馈(误报/属实) → 阈值与模型校准
```

### 5.3 规则进化流
```
审计员用自然语言描述新造假模式
  → LLM 转化为可执行规则
  → 沙箱用历史数据验证命中率
  → 评审通过 → 投入生产(版本留痕)
  → 反馈迭代优化 → 沉淀进规则库
```

---

## 6. 角色权限矩阵

> ✅ 允许　🔶 限本人/受限　❌ 禁止。体现独立性与分权制衡（R19）。

| 功能 / 角色 | 审计员 | 审计主管 | 规则管理员 | 系统管理员 | 系统审计员 | 业务方 |
| --- | --- | --- | --- | --- | --- | --- |
| 自然语言查询 | ✅ | ✅ | ✅ | 🔶 | ✅ | ❌ |
| 查看线索 | 🔶本人 | ✅全部 | ✅ | ❌ | ✅全部 | ❌ |
| 研判/定性线索 | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| 分派线索 | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
| 删除线索 | ❌ | ❌ | ❌ | ❌ | ❌ | ❌ |
| 配置/修改规则 | ❌ | 🔶审批 | ✅ | ❌ | ❌ | ❌ |
| 调整阈值 | ❌ | 🔶审批 | ✅ | ❌ | ❌ | ❌ |
| 出具报告 | ✅ | ✅ | ❌ | ❌ | 🔶审计报告 | ❌ |
| 数据接入配置 | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ |
| 权限分配 | ❌ | 🔶 | ❌ | ✅ | ❌ | ❌ |
| 查看自审计轨迹 | ❌ | 🔶 | ❌ | 🔶 | ✅ | ❌ |
| 模型部署/升级 | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ |

> 关键约束：任何角色均不能删除已生成线索；规则/阈值变动需审批且全程留痕；业务方对系统无任何写权限。

---

## 7. 版本规划

### 一期 · MVP（约 3 个月，对标蓝图部署节奏）
- 第 1 月：本地算力+模型部署；数据接入；搭建审计数据中台（接入+本体+时态最小集）。
- 第 2 月：场景微调；政企拆单（R8）+ 养卡骗补（R9）跑通；历史数据全量重跑同台盲测。
- 第 3 月：投产；产出首批 200–500 条线索；人机闭环 + 系统自审计上线；规则库首轮进化。
- 范围：R1-R5、R7、R8、R9、R17、R18(基础)、R19、R20。

### 二期 · 能力扩展
- 规则进化引擎完整化（R6）；新增场景 R10/R11/R15；风险热力图（R16）；误报反馈学习（R18）；运营看板与盲测报告（R21）。

### 三期 · 全域覆盖
- 接入场景 R12/R13/R14；增量近实时常态化（R3 完整）；信创适配深化；规则库规模化沉淀。

---

## 8. 非功能性要求（摘自需求并细化）
- **安全合规（红线）**：全链路内网闭环，数据零出域；不可篡改操作日志；敏感数据访问控制与脱敏。（R5.1）
- **性能时效**：支撑 70B 级本地推理；常规查询秒级；150 亿级全量扫描异步执行并反馈进度。（R5.2）
- **易用性**：审计员零门槛，自然语言交互，无需写 SQL。（R5.3）
- **可扩展**：新增数据源/场景/规则不重构核心；模型可替换升级。（R5.4）
- **可追溯可解释**：结论可回溯到模型/规则/数据三重版本；线索均附证据链与理由。（R5.5）
- **信创适配**：可适配国产 GPU 与信创软硬件。（R5.6）

---

## 9. 依赖与风险

### 9.1 依赖
- 本地 GPU 算力（A100/H100/国产 GPU）到位。
- 各业务系统可提供接口/库访问/文件导出之一。
- 过去 2–3 年历史审计数据与结论可用于微调与盲测。
- 初期可用脱敏/样例数据开发与演示。

### 9.2 风险与应对
| 风险 | 影响 | 应对 |
| --- | --- | --- |
| 数据治理工作量被低估 | 拖累全量穿透落地 | 数据中台提前立项、独立排期、最小集先行 |
| 主数据对不齐 | 关联穿透失效 | 本体先行、对齐失败显式标记人工干预 |
| 误报过多 | 审计员被淹没 | 置信度三级分流 + 反馈学习 + 可解释证据链 |
| 模型幻觉/误判 | 线索不可信 | 证据链强制、沙箱验证、人工复核闭环 |
| 算力不足 | 推理性能不达标 | 异步任务、分级调度、信创适配评估 |
| 独立性被破坏 | 放水/拦截 | 分权制衡、线索不可删、三重版本留痕、系统自审计 |
| 数据出域 | 合规红线事故 | 内网闭环架构、出域阻断、全链路留痕 |

---

> **请检查确认本 PRD。** 确认通过后，我将进入下一阶段，基于本文档生成开发任务文档 `2-task-AIAudit.md`（可勾选任务清单，标注目标、对应需求/PRD、验收标准、依赖与优先级/阶段）。如需修改，请直接告诉我要调整的部分。