18 KiB
18 KiB
数据不出域,审计全穿透(优化版)
基于本地私有化大模型的电信运营商 AI 全域内审体系 让 150 亿业务里的每一分钱,都在本地 AI 的显微镜下原形毕露 2026 年 6 月
幻灯片 1 · 封面
数据不出域,审计全穿透
- 基于本地私有化大模型的电信运营商 AI 全域内审体系
- 不是一套工具,而是一套"建在自己机房里、越用越聪明"的审计能力体系
- 2026 年 6 月
幻灯片 2 · 为什么传统审计"查不过来"?
三个数字看清困局
- 150 亿 —— 年业务规模
- 5000 万 —— 潜在异常金额
- 5% —— 传统抽样覆盖率
三类典型困局
- "拆单规避":8 个客户各签 600 万 ICT 项目,全拆成 80 万以下小额合同,三重一大抽样完美避开。按金额抽样,大额拆分后消失在雷达之外。
- "稳定的定,稳定的退":每月新增 6000 人订购彩铃,3 个月后首月用户全部退订。渠道已按新增量领取佣金,形成"骗补后弃养"闭环——造假藏在时序里。
- "Excel 干不过来":安全云盘 + 宏 + 人工,面对海量单据只能抽样,查不全、查不深。150 亿业务海洋中,5000 万异常如针落大海。
核心矛盾:审计数据涉及政企合同、用户隐私、财务凭证,上公有云大模型 = 裸奔;不上 AI 又干不过来。怎么办?
幻灯片 3 · 本地 LLM 让"安全"和"智能"不再二选一
| 对比维度 | 传统抽样审计 | 公有云 AI 审计 | 本地 LLM 审计(我们) |
|---|---|---|---|
| 数据范围 | 按金额抽样,查不全 | 全量扫描,但数据出域 | 全量扫描,数据不出机房 |
| 规则能力 | 规则写死,反向规避 | 模型能力强,但合规风险高 | 模型私有化,合规可控 |
| 响应效率 | Excel 翻表,效率低 | 实时预警,但依赖外网 | 内网闭环,秒级响应 |
| 交互模式 | 人找数据 | 数据找人,但数据送人 | 数据找人,数据原地不动 |
| 能力归属 | 经验在人脑,人走经验走 | 能力在外部,租用即失 | 能力沉淀在本地,越用越聪明 |
把千问 70B / DeepSeek 装进本地机房,让 AI 在数据旁边干活,而不是把数据送给 AI。
幻灯片 4 · 【新增】审计域全景图 + 风险分级模型
不是 8 个孤立场景,而是一张覆盖全业务的审计地图
把所有审计场景归入五大风险域,做到"全覆盖、有优先级":
| 风险域 | 覆盖场景 | 关注核心 |
|---|---|---|
| 收入域 | 政企收入穿透、收入成本跨期匹配、云业务空转 | 收入真实性、确认时点 |
| 成本域 | 渠道佣金、终端补贴、成本摊销 | 成本真实性、套利 |
| 采购域 | 网络建设、工程采购、围标串标 | 采购合规、虚增工程量 |
| 资金域 | 回款挂账、网间结算、资金流向 | 资金真实性、关联交易 |
| 合规域 | 员工舞弊、权限滥用、积分套现 | 内控有效性、权限合规 |
风险热力图(发生概率 × 金额影响)
- 高概率 + 高金额 → 优先全量监控(如政企拆单、渠道骗补)
- 低概率 + 高金额 → 重点定向穿透(如围标串标、云空转)
- 高概率 + 低金额 → 批量聚类筛查(如积分套现、内部号码)
让客户一眼看出:我们不是"工具集合",是"有体系、有优先级的全域审计框架"。
幻灯片 5 · "本地 AI 审计大脑"四大核心引擎
- ① 本地私有化 LLM 引擎(底座):千问 70B / DeepSeek 等模型本地化部署,审计数据绝不出域。负责异常模式推理、自然语言规则配置、报告自动生成、线索解释。
- ② 全量穿透引擎:直连 BSS / OSS / ERP / 财务系统,本地数据库直接喂给本地 LLM。不抽样,对所有合同、回款、用户行为做关联扫描。
- ③ 规则进化引擎(护城河):审计人员用自然语言描述新造假模式,LLM 自动转化为可执行规则,沙箱验证命中率,持续对抗迭代——把顾问脑子里的经验固化成机构永久资产。
- ④ 线索驱动引擎:LLM 对异常聚类做"人话解释"(如"这 8 个客户疑似同一实控人"),输出高价值线索并附证据链,直接推送审计人员桌面。
幻灯片 6 · 场景一:政企收入全链路穿透
- 业务链路:客户立项 → 移动立项 → 审批 → 报价 → 签约 → 首款/二款开票 → 回款
- 经典案例(拆单规避 + 虚假回款):某地市公司 8 个"客户"各签 600 万 ICT 项目,全拆成 79 万-99 万合同规避三重一大审批。首款付 100 万、二款付 300 万,尾款 500 万长期挂账。经穿透,8 个客户注册地址在同一写字楼、法人为同一人亲属、付款账户来自同一实控企业。
- AI 审计点:合同金额分布异常(集中在阈值边缘);工商关联穿透(隐性实控人识别);回款时序聚类(批量违约模式)。
- 本地 LLM 能力:自然语言查数、关联推理、一键生成《政企客户回款异常专项线索清单》。
幻灯片 7 · 场景二:市场业务真实性("养卡骗补")
- 经典案例(稳定的定,稳定的退):某渠道每月新增 6000 人订购彩铃,每过三个月首月用户全部退订,渠道已按新增量领取佣金,形成"骗补后弃养"闭环。用户号码归属地高度集中在某几个乡镇,且通话记录为零。
- 扩展案例(物联网卡虚假激活):某代理商批量开通 10 万张物联网卡,声称用于"智慧停车",实际激活后无任何流量,已按激活量领取每台 50 元补贴,半年后卡片集体沉默。
- AI 审计点:用户生命周期时序模式识别;渠道佣金与业务质量匹配度;沉默/零通话用户批量聚类;项目交付物与收入确认交叉验证。
- 本地 LLM 能力:识别"脉冲式增长 + 规律性衰减"的周期性造假,自动提炼为新规则。
幻灯片 8 · 场景三:收入与成本跨期匹配
- 经典案例(趸交收入一次性确认):用户办 24 个月套餐送智能手表,收入应分 24 个月确认,但因趸交财务一把全确认,手表成本却摊 24 个月——确认时点严重错配。某省一年此类业务 5000 万,在 150 亿总收入中如针落大海。
- 扩展案例("以销定产"变"提前确认"):某政企云项目约定"按实际使用量计费",但财务在设备上架当月即全额确认收入,客户前 6 个月几乎零使用。
- AI 审计点:自动勾稽收入确认政策 vs 实际账务 vs 合同条款;识别趸交/预收款一次性确认异常分录;成本摊销与收入确认跨期匹配;设备交付与收入确认时间差监控。
- 本地 LLM 能力:跨系统自动勾稽,识别收入成本确认时点错配的异常分录模式。
幻灯片 9 · 场景四:渠道佣金与代理商套利
- 经典案例(虚假放号 + 套机套卡):某代理商为完成"5G 用户净增",批量买低价老人机插 5G SIM 卡激活后丢弃,用户从未产生 5G 流量,已领"5G 迁转"佣金每台 200 元 + 终端补贴 300 元,次月用户全部流失。
- 扩展案例(异地窜货套利):代理商从邻省低价采购同款手机,在本省以"新用户入网"名义领高额补贴,手机实际回流二级市场。
- AI 审计点:终端 IMEI 与用户绑定真实性;佣金发放与在网时长匹配度;终端流向追踪(激活即沉默/跨省流通);代理商业务质量时序衰减分析。
- 本地 LLM 能力:IMEI 级终端流向追踪,识别"激活-沉默-流失"套利闭环。
幻灯片 10 · 场景五:网络建设与工程采购
- 经典案例(围标串标 + 虚增工程量):某基站项目 3 家投标报价差异不足 1%,技术方案大量雷同,中标后施工队为同一班组,工程量签证单存在"同一笔迹不同日期"批量签字。
- 扩展案例(虚假巡检与虚报工单):某外包商系统显示每月完成 2000 次基站巡检,GPS 轨迹比对实际只到过 300 个站点,其余为"照片复用 + 坐标伪造"。
- AI 审计点:投标关联分析(报价相似度、文件雷同度);工程量与资源消耗匹配验证;巡检轨迹与工单交叉验证;供应商画像(同一实控人"马甲"识别)。
- 本地 LLM 能力:NLP 比对投标文件雷同度,GPS 轨迹与工单交叉验证,识别"马甲"供应商。
幻灯片 11 · 场景六:互联互通与网间结算
- 经典案例(话务量操纵套利):某运营商与境外运营商合谋虚假国际来话刷量,主叫归属地为虚商号段,通话时长均为 30 秒/60 秒整数倍,明显非真人。
- 扩展案例(短信网关刷量):某 SP 伪造发送记录申报"成功发送"10 亿条行业短信按 0.05 元/条结算,实际到达率不足 10%。
- AI 审计点:话务量时序异常(突发峰值、整数时长聚集);网间结算数据与网络侧原始信令比对;SP/CP 业务量与收入结算交叉验证;国际来话真实路由溯源。
- 本地 LLM 能力:识别"整数倍通话时长"等非人类行为,信令级原始数据比对。
幻灯片 12 · 场景七:云业务 / IDC 与新兴业务
- 经典案例(云资源"空转"确认收入):某政企客户签 3 年云服务年付 100 万,实际 CPU 利用率长期低于 5%、存储几乎为空,但财务按合同全额确认收入,且该"客户"实控人为地市公司某领导亲属。
- 扩展案例(IDC 机柜"虚租"):某 IDC 宣称出租率 90%,实际大量机柜无设备、电费为零,收入来自关联方"预付租金"。
- AI 审计点:云资源实际使用量 vs 合同计费量匹配度;IDC 出租率与电力消耗勾稽;新兴业务客户画像(关联方识别、预付模式异常);收入确认与交付验收时序一致性。
- 本地 LLM 能力:资源利用率与计费量自动比对,关联方网络挖掘,识别"空转"收入。
幻灯片 13 · 场景八:员工内部舞弊与资源滥用
- 经典案例(内部号码套利):某营业厅员工利用权限批量开通"员工测试号"对外出租"免流套餐",测试号产生大量流量收入但全部计入内部成本未确认收入。
- 扩展案例(积分/会员体系套现):某员工勾结外部商户虚构消费批量刷积分,兑换高价值礼品卡在二级市场变现,某商户单日积分发放量超正常 100 倍。
- AI 审计点:员工权限操作日志异常模式识别;内部测试号实际用途偏离;积分/电子券流向追踪;权限与岗位匹配度(如客服岗有财务调账权限)。
- 本地 LLM 能力:操作日志异常模式挖掘,权限-岗位匹配度分析,积分流向网络追踪。
幻灯片 14 · 【新增】数据接入与治理层(地基工程)
全量穿透的前提,是把脏活干在前面
- 多源异构接入:适配 BSS / OSS / ERP / 财务 / 合同 / 工单 / 信令各系统的接口、数据库、文件,统一汇入本地数据湖。
- 主数据对齐:客户、合同、号码、工单、供应商跨系统实体统一,解决"主键对不上"。
- 数据质量探查与清洗:缺失、重复、口径不一自动探查并清洗,建立质量评分。
- 增量同步与时效:从年度快照升级为近实时增量,支撑常态化监控。
数据治理是这套体系工作量最大、最该提前立项的一环。我们把它写进方案、承担下来,而不是回避。
幻灯片 15 · 【新增】人机协同闭环:线索之后才是价值
从"发现工具"升级为"办案平台"
AI 全量扫描 → 生成线索 + 初步证据链 → 审计员复核研判 →
系统自动生成审计底稿 → 定性分类 → 整改 / 移交 → 复核销项闭环
- AI 侧:出线索、附证据链、给判定理由、自动生成可追溯底稿。
- 审计员侧:复核研判、定性、决定整改或移交、最终签字。
- 闭环管理:线索分派、取证留痕、整改跟踪、销项复核全流程在线。
不是"给你一堆线索然后呢",而是"从发现到闭环,每一步都接得住、留得痕"。
幻灯片 16 · 【新增】误报治理与置信度分级(专业 = 诚实)
全量扫描必然产生海量疑似项——关键是不让审计员淹死在假阳性里
- 三级置信分流:高置信直接推送处置、中置信人工复核、低置信归档备查。
- 每条线索可解释:附证据链 + 判定理由,拒绝"黑盒打分"。
- 反馈学习闭环:审计员标注"误报/属实",系统持续校准阈值,准确率随使用上升。
- 公开运营指标:命中率、准确率、线索转化率上看板,成效可量化、可追溯。
主动交代精准度,反而显专业。藏着不说,才是最大的风险。
幻灯片 17 · 本地私有化 LLM 审计平台架构
- 应用层:自然语言查询 · 线索看板 · 智能报告 · 预警推送 —— 审计人员零门槛使用
- 引擎层:全量穿透引擎 + 规则进化引擎 + 线索生成引擎 —— LLM 驱动三大引擎
- 数据层:本地数据湖(BSS / OSS / ERP / 财务 / 合同 / 工单 / 信令)—— 直连内网,零出域
- 模型层:千问 70B / DeepSeek / 自研行业模型 —— 审计领域微调,懂电信业务
- 算力层:本地 A100 / H100 / 国产 GPU 集群 —— 承载 70B 级大模型推理,信创可适配
- 安全合规与自审计层(贯穿全栈):权限分级 · 操作不可篡改日志 · 模型/规则版本留痕 · 全链路审计轨迹
全链路内网闭环 · 数据零出域
幻灯片 18 · 【新增】独立性与系统自审计(制度设计)
审计系统本身,也要经得起审计
- 防放水:规则配置、阈值调整全程留痕,任何人改动可追溯,杜绝"调教规则放水"。
- 防拦截:线索一旦生成即不可删除,处置过程全程记录,杜绝"线索被领导拦下"。
- 权限分级:配规则、看线索、改阈值、出报告分权管理,相互制衡。
- 可追溯:模型版本、规则版本、数据版本三重留痕,任一结论可回溯到当时的模型与数据状态。
既当运动员又当裁判是内审的大忌——我们用制度化的留痕和分权,让这套系统自己也透明可查。
幻灯片 19 · 本地 LLM 带来的四重跃升
- 安全价值:敏感数据不出机房,满足国资/运营商/等保最严要求,模型-数据-推理-结果全链路内网闭环。
- 能力价值:70B 级本地模型具备语义推理、规则自生长、报告生成能力,远超传统 BI;行业微调,懂电信业务。
- 效率价值:自然语言交互,不写 SQL、不翻 Excel,问一句就出线索,从"人找数据"到"数据找人"。
- 进化价值:每发现一种造假,LLM 自动提炼规则,系统越用越精准,形成机构专属审计知识库。
| 关键跃升 | 从 → 到 |
|---|---|
| 审计覆盖面 | 5% → 100% |
| 数据出域风险 | 存在 → 归零 |
| 审计节奏 | 年度快照 → 7×24 常态化 |
| 能力归属 | 外部租用 → 本地永久沉淀 |
幻灯片 20 · 【新增】价值测算:把"异常"变成客户的钱
以 150 亿业务规模、5000 万潜在异常为基准的保守测算
| 价值来源 | 测算逻辑 | 年化收益(保守) |
|---|---|---|
| 可挽回收入/止损 | 全量覆盖挖出抽样漏掉的异常并整改 | 数千万级 |
| 外部咨询费节省 | 常态化自有能力替代重复性项目制采购 | 百万级/年 |
| 人力释放 | 审计员从翻表取数转向研判处置 | 数倍效率提升 |
| 风险事件预防 | 提前发现合规风险,规避处罚与声誉损失 | 难以估量 |
投入一次本地化建设,沉淀的是持续产生收益的永久资产,而非每年重复支出的项目费用。
幻灯片 21 · 【新增】我们的差异化:能力沉淀,而非一次性交付
为什么是"建一套体系",而不是"买一份报告"
- 能力沉淀 vs 项目制交付:项目制是"租大脑",人走经验走、明年再付一次;我们是"装一个永久的、越用越聪明的本地大脑",规则进化引擎把每一次审计经验固化为机构资产。
- 常态化 vs 年度快照:舞弊是动态的,审计不能一年一次。时序类造假(养卡、骗补、脉冲式增长)恰恰是抽样和年度审计抓不到的,正是本地 LLM + 全量数据的主场。
- 数据不出域 vs 数据出域:对等保/国资/数据安全红线极高的运营商,"一比特不出机房"是结构性优势,让安全合规部门站在我们这边。
- 共存切入 vs 正面替代:先做底层全量穿透与常态化监控这块"以前做不动的层",跑出线索、证明价值,能力自然沉淀、份额自然扩展。
幻灯片 22 · 3 个月本地部署跑通(含同台盲测验证)
- 第 1 个月 · 算力 + 模型部署:机房 GPU 到位;千问 70B / DeepSeek 本地化部署;对接 BSS/OSS/ERP/财务/工单/信令;构建本地数据湖。
- 第 2 个月 · 场景微调 + 历史盲测:历史审计案例行业微调;政企/市场/财务/工程场景适配;用过去 2-3 年历史数据全量重跑,与既有审计结论同台盲测,验证能否挖出此前抽样漏掉的真实线索。
- 第 3 个月 · 投产 + 线索闭环:正式上线;生成首批 200-500 条线索;审计人员跟进核查反馈;规则库首轮进化。
交付物:一套本地私有化 AI 审计平台 + 一套可进化的审计规则库 + 一批已验证的高价值线索 + 一份同台盲测成效报告。
幻灯片 23 · 审计的终极形态
- 数据不动、AI 动脑、造假者跑不掉
- 本地大模型 + 全量穿透 + 规则进化 = 运营商内审的"新质生产力"
- 让我们把千问 70B 装进您的机房
- 150 亿业务全量扫描,敏感数据一比特不出域——这才是电信运营商该有的 AI 审计
2026 年 6 月