# 第五章 部署与运维架构 > 版本:V1.0 > 基于文档:《AIGC-Hub智视码(AVCC)体系建设方案 V2.0》 --- ## 5.1 Kubernetes 部署拓扑 ``` ┌─────────────────────────────────────────────────────────────────┐ │ 广电云 K8s 集群 (等保三级 VPC) │ │ ┌──────────────────────────────────────────────────────────┐ │ │ │ Ingress Controller (Kong/Nginx) │ │ │ │ TLS 1.3 终止, 3 replicas │ │ │ └──────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌───────────────────────────▼──────────────────────────────┐ │ │ │ 微服务应用层 │ │ │ │ code-svc(5) review-svc(10) chain-svc(3) │ │ │ │ gateway-svc(5) settlement-svc(3) workbench-svc(3) │ │ │ │ callback-svc(3) regulatory-svc(2) │ │ │ └──────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌───────────────────────────▼──────────────────────────────┐ │ │ │ 数据与中间件层 │ │ │ │ PostgreSQL(3) Redis(6) Kafka(3) ClickHouse(3) │ │ │ │ MinIO(4) Elasticsearch(3) Milvus(3) │ │ │ └──────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌───────────────────────────▼──────────────────────────────┐ │ │ │ AI 推理与区块链层 │ │ │ │ Triton Server(GPU) ChainMaker(5) Prometheus+Grafana │ │ │ └──────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────┘ ``` ## 5.2 一期试点资源预估 | 组件 | 实例规格 | 数量 | 说明 | |------|----------|------|------| | API 网关 | 4C8G | 3 | Kong | | 微服务 Pod | 2C4G | 30 | 各服务副本合计 | | PostgreSQL | 8C32G + 1TB SSD | 3 | 1主2从 + Patroni | | Redis | 4C8G | 6 | 3主3从集群 | | Kafka | 4C8G + 500GB | 3 | 3 Broker | | ClickHouse | 8C16G + 2TB SSD | 3 | 分布式 | | MinIO | 4C8G + 10TB | 4 | 4节点对象存储 | | Triton Server | 8C32G + A10 GPU | 4 | AI 推理 | | ChainMaker | 8C16G + 500GB | 5 | 5 组织节点 | | Elasticsearch | 4C16G + 2TB | 3 | 日志存储 | ## 5.3 网络与安全域 | 安全域 | 组件 | 访问策略 | |--------|------|----------| | DMZ | Kong Ingress | 公网 443,WAF 防护 | | 应用区 | 微服务 Pod | 仅内网,服务网格 mTLS | | 数据区 | PG/Redis/Kafka | 应用区白名单,审计连接 | | AI 推理区 | Triton Server | 应用区白名单,GPU 独占 | | 区块链区 | ChainMaker | 专线/VPN,联盟组织互连 | | 监管区 | regulatory-svc | 专线对接广电总局专网 | ## 5.4 高可用与灾备 | 策略 | 实现 | RPO | RTO | |------|------|-----|-----| | PG | Patroni + 流复制 | <1s | <30s | | Redis | Cluster 自动故障转移 | 0 | <10s | | ClickHouse | 副本 + ReplicatedMergeTree | <1min | <5min | | MinIO | 纠删码 4+2 | 0 | <1min | | 跨可用区 | 北京主 + 上海备(异步) | <5min | <15min | ## 5.5 监控告警体系 | 层级 | 工具 | 监控对象 | |------|------|----------| | 基础设施 | Prometheus + Node Exporter | CPU/内存/磁盘/网络/GPU | | 应用指标 | Prometheus + Micrometer | QPS/延迟/错误率/饱和度 | | 日志 | ELK / Loki | 全链路日志聚合 | | 链路追踪 | Jaeger + OpenTelemetry | 分布式请求追踪 | | 告警 | AlertManager + PagerDuty | 多通道分级告警 | --- *上一章:[04-API接口设计.md](04-API接口设计.md)* *下一章:[06-安全设计.md](06-安全设计.md)*