a329d4906b
- 方案文档: AVCC 体系建设、IPTV TCS 需求(0-req)/PRD(1-prd)/任务(2-task)/二三四期任务 - tcs-iptv: Go 后端(哈希SDK/MA码生成/可信数据空间mock/业务编排/HTTP API+HMAC鉴权) - web-console: React+AntD 监管大屏(角色工作台/全流程演示/监管片库) - 一剧一码+集级哈希, 集级下架/恢复, 全栈测试通过
5.1 KiB
5.1 KiB
第五章 部署与运维架构
版本:V1.0
基于文档:《AIGC-Hub智视码(AVCC)体系建设方案 V2.0》
5.1 Kubernetes 部署拓扑
┌─────────────────────────────────────────────────────────────────┐
│ 广电云 K8s 集群 (等保三级 VPC) │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ Ingress Controller (Kong/Nginx) │ │
│ │ TLS 1.3 终止, 3 replicas │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ┌───────────────────────────▼──────────────────────────────┐ │
│ │ 微服务应用层 │ │
│ │ code-svc(5) review-svc(10) chain-svc(3) │ │
│ │ gateway-svc(5) settlement-svc(3) workbench-svc(3) │ │
│ │ callback-svc(3) regulatory-svc(2) │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ┌───────────────────────────▼──────────────────────────────┐ │
│ │ 数据与中间件层 │ │
│ │ PostgreSQL(3) Redis(6) Kafka(3) ClickHouse(3) │ │
│ │ MinIO(4) Elasticsearch(3) Milvus(3) │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ┌───────────────────────────▼──────────────────────────────┐ │
│ │ AI 推理与区块链层 │ │
│ │ Triton Server(GPU) ChainMaker(5) Prometheus+Grafana │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
5.2 一期试点资源预估
| 组件 | 实例规格 | 数量 | 说明 |
|---|---|---|---|
| API 网关 | 4C8G | 3 | Kong |
| 微服务 Pod | 2C4G | 30 | 各服务副本合计 |
| PostgreSQL | 8C32G + 1TB SSD | 3 | 1主2从 + Patroni |
| Redis | 4C8G | 6 | 3主3从集群 |
| Kafka | 4C8G + 500GB | 3 | 3 Broker |
| ClickHouse | 8C16G + 2TB SSD | 3 | 分布式 |
| MinIO | 4C8G + 10TB | 4 | 4节点对象存储 |
| Triton Server | 8C32G + A10 GPU | 4 | AI 推理 |
| ChainMaker | 8C16G + 500GB | 5 | 5 组织节点 |
| Elasticsearch | 4C16G + 2TB | 3 | 日志存储 |
5.3 网络与安全域
| 安全域 | 组件 | 访问策略 |
|---|---|---|
| DMZ | Kong Ingress | 公网 443,WAF 防护 |
| 应用区 | 微服务 Pod | 仅内网,服务网格 mTLS |
| 数据区 | PG/Redis/Kafka | 应用区白名单,审计连接 |
| AI 推理区 | Triton Server | 应用区白名单,GPU 独占 |
| 区块链区 | ChainMaker | 专线/VPN,联盟组织互连 |
| 监管区 | regulatory-svc | 专线对接广电总局专网 |
5.4 高可用与灾备
| 策略 | 实现 | RPO | RTO |
|---|---|---|---|
| PG | Patroni + 流复制 | <1s | <30s |
| Redis | Cluster 自动故障转移 | 0 | <10s |
| ClickHouse | 副本 + ReplicatedMergeTree | <1min | <5min |
| MinIO | 纠删码 4+2 | 0 | <1min |
| 跨可用区 | 北京主 + 上海备(异步) | <5min | <15min |
5.5 监控告警体系
| 层级 | 工具 | 监控对象 |
|---|---|---|
| 基础设施 | Prometheus + Node Exporter | CPU/内存/磁盘/网络/GPU |
| 应用指标 | Prometheus + Micrometer | QPS/延迟/错误率/饱和度 |
| 日志 | ELK / Loki | 全链路日志聚合 |
| 链路追踪 | Jaeger + OpenTelemetry | 分布式请求追踪 |
| 告警 | AlertManager + PagerDuty | 多通道分级告警 |
上一章:04-API接口设计.md
下一章:06-安全设计.md