# 1-prd-AIAudit · 产品需求文档(PRD) > 项目:基于本地私有化大模型的电信运营商 AI 全域内审平台(AIAudit) > 版本:v0.1(待评审) > 日期:2026-06 > 上游来源:`0-req-AIAudit.md` --- ## 1. 产品概述与定位 ### 1.1 一句话定位 **AIAudit 是一套建在运营商自己机房、数据零出域、覆盖全业务域、越用越聪明的本地 AI 内审能力体系**——不是一套工具,而是一套可持续进化、归审计独立掌控的审计大脑。 ### 1.2 产品形态 - 部署形态:本地私有化部署(内网闭环,数据一比特不出机房)。 - 能力构成:审计专用数据中台(底座)+ 四大引擎(LLM / 全量穿透 / 规则进化 / 线索驱动)+ 人机协同闭环(线索到销项)+ 系统自审计(独立可信)。 - 交付物:本地 AI 审计平台 + 可进化规则库 + 已验证高价值线索 + 同台盲测成效报告。 ### 1.3 与现有方式的差异化 | 维度 | 传统抽样审计 | 公有云 AI 审计 | AIAudit(本地) | | --- | --- | --- | --- | | 数据范围 | 按金额抽样,查不全 | 全量但数据出域 | 全量且数据不出机房 | | 合规风险 | 低但能力弱 | 能力强但合规风险高 | 私有化、合规可控 | | 响应效率 | Excel 翻表 | 实时但依赖外网 | 内网闭环秒级响应 | | 能力归属 | 经验在人脑 | 能力外部租用 | 本地永久沉淀,越用越聪明 | | 独立性 | 依赖人工 | 数据送人 | 审计独立掌控、自身可审计 | --- ## 2. 目标与成功指标 ### 2.1 业务目标 - 把审计覆盖率从约 5% 提升到接近 100%(全量穿透)。 - 把审计节奏从年度快照升级为 7×24 常态化监控。 - 把审计经验固化为机构永久资产(可进化规则库)。 - 数据出域风险归零,满足国资/运营商/等保最严要求。 ### 2.2 成功指标(KPI) | 指标 | 目标(首期/稳态) | 对应需求 | | --- | --- | --- | | 审计覆盖率 | ≥ 95%(全量扫描) | R5 | | 数据出域事件 | 0 起 | 非功能 5.1、R1 | | 同台盲测命中率 | 复现既有审计结论 + 发现新增真实线索 | R21 | | 线索准确率(高置信) | 随反馈学习持续提升 | R18 | | 线索转化率(线索→属实立案) | 可量化、上看板 | R18、R21 | | 首批线索产出 | 投产首月 200–500 条 | R7 | | 可挽回收入/止损 | 年化数千万级(保守) | R21 | | 查询响应 | 常规查询秒级,全量任务异步反馈进度 | 非功能 5.2 | ### 2.3 非目标(本产品不做) - 不替代业务系统本身的生产功能。 - 不做面向业务方共享的全行级数据中台。 - 不做需要数据出域的任何云端推理。 --- ## 3. 用户画像与核心场景(痛点解法) ### 3.1 用户画像 | 角色 | 画像 | 关键诉求 | | --- | --- | --- | | 审计员 | 一线内审,业务熟但不写代码 | 看懂线索、查到证据、处置留痕 | | 审计主管 | 部门负责人 | 全局掌控、成效可量化、流程合规 | | 规则管理员 | 资深审计/规则专家 | 自然语言配规则、沙箱验证、版本可控 | | 系统管理员 | IT 运维 | 接入稳定、权限可控、运行可观测 | | 系统审计员 | 独立监督岗 | 改动可追溯、线索不可被删被拦 | ### 3.2 核心场景与痛点解法 | 场景 | 痛点 | AIAudit 解法 | 对应需求 | | --- | --- | --- | --- | | 政企拆单规避 | 大额拆小额规避三重一大,抽样避开 | 金额阈值边缘分布识别 + 工商关联穿透 + 回款时序聚类 | R8 | | 养卡骗补 | 脉冲新增+规律退订,藏在时序里 | 用户生命周期时序模式识别 + 佣金质量匹配 | R9 | | 收入成本跨期错配 | 趸交一次性确认、成本分摊错配 | 政策/账务/合同三方勾稽 + 时点错配识别 | R10 | | 渠道套利套机 | 虚假放号、套卡、异地窜货 | IMEI 级流向追踪 + 佣金在网时长匹配 | R11 | | 围标串标 | 报价雷同、马甲供应商、虚增工程量 | 投标关联分析 + 巡检轨迹交叉验证 + 供应商画像 | R12 | | 网间结算刷量 | 话务/短信刷量套结算 | 整数时长识别 + 信令比对 + 到达率交叉验证 | R13 | | 云空转/IDC虚租 | 资源闲置却全额确认收入 | 利用率vs计费量比对 + 电力勾稽 + 关联方识别 | R14 | | 内部舞弊 | 内部号套利、越权、积分套现 | 操作日志异常 + 权限岗位匹配 + 积分流向追踪 | R15 | > 共性痛点:"数据涉密不能出域 + 海量单据查不过来 + 时序造假抽样抓不到"。共性解法:"本地 LLM + 审计数据中台全量穿透 + 规则进化 + 人机闭环"。 --- ## 4. 功能清单与优先级(MoSCoW) > 优先级:Must(一期 MVP 必须)/ Should(二期)/ Could(三期)/ Won't(暂不做)。映射回 `0-req-AIAudit.md` 需求编号。 ### 4.1 数据中台与底座 | 功能 | 优先级 | 需求映射 | | --- | --- | --- | | 多源异构数据接入(接口/库/文件) | Must | R1 | | 审计专用数据底座(物理隔离、独立掌控) | Must | R2 | | 本体建模与审计知识图谱 | Must | R2 | | 主数据对齐与数据清洗/质量评分 | Must | R2 | | 双时态/时序建模与版本回溯 | Must | R3 | | 增量同步与常态化重算 | Should | R3 | | 统一穿透/图谱查询服务 | Must | R2 | ### 4.2 核心引擎 | 功能 | 优先级 | 需求映射 | | --- | --- | --- | | 本地私有化 LLM 部署与推理 | Must | R4 | | 自然语言查数(不写 SQL) | Must | R4、R20 | | 全量穿透扫描引擎 | Must | R5 | | 跨系统关联穿透 | Must | R5、R2 | | 规则进化引擎(NL→规则) | Should | R6 | | 规则沙箱验证与版本管理 | Should | R6 | | 线索生成 + 证据链 + 人话解释 | Must | R7 | | 线索价值排序与推送 | Must | R7、R20 | ### 4.3 审计场景 | 功能 | 优先级 | 需求映射 | | --- | --- | --- | | 场景一 政企收入全链路穿透 | Must | R8 | | 场景二 养卡骗补识别 | Must | R9 | | 场景三 收入成本跨期匹配 | Should | R10 | | 场景四 渠道佣金与套利 | Should | R11 | | 场景五 网络建设与工程采购 | Could | R12 | | 场景六 互联互通与网间结算 | Could | R13 | | 场景七 云业务/IDC | Could | R14 | | 场景八 员工内部舞弊 | Should | R15 | > 一期场景优先级建议:选取"高概率×高金额"的政企拆单(R8)与养卡骗补(R9)作为 MVP 跑通,其余按风险热力图分期接入。最终优先级以评审为准。 ### 4.4 闭环、治理与应用 | 功能 | 优先级 | 需求映射 | | --- | --- | --- | | 风险域全景与热力图 | Should | R16 | | 线索分派→研判→定性→整改→销项闭环 | Must | R17 | | 审计底稿自动生成 | Should | R17 | | 置信度三级分流 | Must | R18 | | 误报反馈学习闭环 | Should | R18 | | 运营指标看板(命中率/准确率/转化率) | Should | R18、R21 | | 系统自审计(留痕/分权/三重版本/线索不可删) | Must | R19 | | 线索看板/智能报告/预警推送 | Must | R20 | | 成效度量与同台盲测报告 | Should | R21 | --- ## 5. 关键流程 ### 5.1 数据流(从接入到可分析) ``` 源系统(BSS/OSS/ERP/财务/合同/工单/信令) → 接入适配(接口/库/文件) → 审计数据中台:清洗/质量评分 → 本体建模/主数据对齐(知识图谱) → 双时态/时序建模 → 统一穿透查询服务 → 全量穿透引擎 + 本地 LLM ``` ### 5.2 审计闭环(从线索到销项) ``` 全量扫描/规则命中 → 生成线索+证据链+判定理由(置信度分级) → 推送/分派审计员 → 复核研判 → 定性分类 → 自动生成审计底稿 → 整改 或 移交 → 销项复核闭环(全程留痕) → 审计员反馈(误报/属实) → 阈值与模型校准 ``` ### 5.3 规则进化流 ``` 审计员用自然语言描述新造假模式 → LLM 转化为可执行规则 → 沙箱用历史数据验证命中率 → 评审通过 → 投入生产(版本留痕) → 反馈迭代优化 → 沉淀进规则库 ``` --- ## 6. 角色权限矩阵 > ✅ 允许 🔶 限本人/受限 ❌ 禁止。体现独立性与分权制衡(R19)。 | 功能 / 角色 | 审计员 | 审计主管 | 规则管理员 | 系统管理员 | 系统审计员 | 业务方 | | --- | --- | --- | --- | --- | --- | --- | | 自然语言查询 | ✅ | ✅ | ✅ | 🔶 | ✅ | ❌ | | 查看线索 | 🔶本人 | ✅全部 | ✅ | ❌ | ✅全部 | ❌ | | 研判/定性线索 | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | | 分派线索 | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ | | 删除线索 | ❌ | ❌ | ❌ | ❌ | ❌ | ❌ | | 配置/修改规则 | ❌ | 🔶审批 | ✅ | ❌ | ❌ | ❌ | | 调整阈值 | ❌ | 🔶审批 | ✅ | ❌ | ❌ | ❌ | | 出具报告 | ✅ | ✅ | ❌ | ❌ | 🔶审计报告 | ❌ | | 数据接入配置 | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ | | 权限分配 | ❌ | 🔶 | ❌ | ✅ | ❌ | ❌ | | 查看自审计轨迹 | ❌ | 🔶 | ❌ | 🔶 | ✅ | ❌ | | 模型部署/升级 | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ | > 关键约束:任何角色均不能删除已生成线索;规则/阈值变动需审批且全程留痕;业务方对系统无任何写权限。 --- ## 7. 版本规划 ### 一期 · MVP(约 3 个月,对标蓝图部署节奏) - 第 1 月:本地算力+模型部署;数据接入;搭建审计数据中台(接入+本体+时态最小集)。 - 第 2 月:场景微调;政企拆单(R8)+ 养卡骗补(R9)跑通;历史数据全量重跑同台盲测。 - 第 3 月:投产;产出首批 200–500 条线索;人机闭环 + 系统自审计上线;规则库首轮进化。 - 范围:R1-R5、R7、R8、R9、R17、R18(基础)、R19、R20。 ### 二期 · 能力扩展 - 规则进化引擎完整化(R6);新增场景 R10/R11/R15;风险热力图(R16);误报反馈学习(R18);运营看板与盲测报告(R21)。 ### 三期 · 全域覆盖 - 接入场景 R12/R13/R14;增量近实时常态化(R3 完整);信创适配深化;规则库规模化沉淀。 --- ## 8. 非功能性要求(摘自需求并细化) - **安全合规(红线)**:全链路内网闭环,数据零出域;不可篡改操作日志;敏感数据访问控制与脱敏。(R5.1) - **性能时效**:支撑 70B 级本地推理;常规查询秒级;150 亿级全量扫描异步执行并反馈进度。(R5.2) - **易用性**:审计员零门槛,自然语言交互,无需写 SQL。(R5.3) - **可扩展**:新增数据源/场景/规则不重构核心;模型可替换升级。(R5.4) - **可追溯可解释**:结论可回溯到模型/规则/数据三重版本;线索均附证据链与理由。(R5.5) - **信创适配**:可适配国产 GPU 与信创软硬件。(R5.6) --- ## 9. 依赖与风险 ### 9.1 依赖 - 本地 GPU 算力(A100/H100/国产 GPU)到位。 - 各业务系统可提供接口/库访问/文件导出之一。 - 过去 2–3 年历史审计数据与结论可用于微调与盲测。 - 初期可用脱敏/样例数据开发与演示。 ### 9.2 风险与应对 | 风险 | 影响 | 应对 | | --- | --- | --- | | 数据治理工作量被低估 | 拖累全量穿透落地 | 数据中台提前立项、独立排期、最小集先行 | | 主数据对不齐 | 关联穿透失效 | 本体先行、对齐失败显式标记人工干预 | | 误报过多 | 审计员被淹没 | 置信度三级分流 + 反馈学习 + 可解释证据链 | | 模型幻觉/误判 | 线索不可信 | 证据链强制、沙箱验证、人工复核闭环 | | 算力不足 | 推理性能不达标 | 异步任务、分级调度、信创适配评估 | | 独立性被破坏 | 放水/拦截 | 分权制衡、线索不可删、三重版本留痕、系统自审计 | | 数据出域 | 合规红线事故 | 内网闭环架构、出域阻断、全链路留痕 | --- > **请检查确认本 PRD。** 确认通过后,我将进入下一阶段,基于本文档生成开发任务文档 `2-task-AIAudit.md`(可勾选任务清单,标注目标、对应需求/PRD、验收标准、依赖与优先级/阶段)。如需修改,请直接告诉我要调整的部分。