Files
2026-06-16 00:55:20 +08:00

250 lines
12 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 中国机车图鉴 · 产品与技术方案
> 一个面向铁路爱好者的、可众包维护的机车知识库与社区平台
> 数据基础:`中国铁路车型统计表(总表)` 共 12 张分类表
---
## 1. 项目愿景
打造一个**「科学严谨 + 趣味探索 + 社区共建」**的中国机车数字图鉴:
- 对爱好者:一个能"逛得进去、查得明白、玩得起来"的机车百科 + 打卡社区。
- 对数据:一份持续生长、有据可查、版本可追溯的开放车型数据库。
- 对社区:一个有荣誉感、有归属感、有交流沉淀的爱好者聚集地。
一句话定位:**机车界的「维基百科 + 观鸟记录 App + 兴趣社区」**。
---
## 2. 数据现状分析
现有 Excel 已覆盖 12 个分类,字段相当完整,是天然的"数据底座"。
| 分类 | 代表字段 | 数据特征 |
|------|----------|----------|
| 蒸汽机车(建国前/后) | 型号、生产商、年代 | 历史向,强时间轴属性 |
| 电力机车 | 牵引力、供电方式、轴列式、时速 | 技术参数密集 |
| 内燃机车 | 系列、传动方式、动力来源 | 有"系列→型号"层级 |
| 动车组(和谐号/复兴号/CJ) | 编组、节数、试验/量产状态 | 强版本/谱系关系 |
| 货车 | 车型大类、车型代码、载重、容积、车钩 | 编码体系清晰 |
| 客车 | 型号、用途 | 数量大 |
| 检测车 / 综合检测列车 | 车号、功能、配属、状态、涂装 | 强"个体实例"属性(精确到车号) |
| 旅游列车 | — | 运营/线路向 |
**关键洞察:**
1. **存在两个数据粒度**——"车型(Model"与"具体车辆个体(Unit,精确到车号)"。检测车表已经到了车号粒度,这正是众包打卡的核心载体。
2. **存在层级与谱系关系**——系列 → 型号 → 改型(如 C62A / C64K),动车组有试验型→量产型演化,适合做"技术族谱"可视化。
3. **字段需要标准化**——现表中存在合并单元格、单位混排(如"整备重量 / 轴重 /t")、空表头等问题,入库前需清洗与字段规范化。
4. **天然带时间维度与空间维度**——首产/停产年份 → 时间轴;配属路局/运营线路 → 地图。
---
## 3. 核心数据模型
采用三层模型,兼顾科学性与众包扩展性:
```
车型分类 (Category)
└── 车型 (Model) ← 百科主体,技术参数挂这里
└── 车辆个体 (Unit) ← 精确到车号,爱好者打卡/拍摄对象
└── 目击记录 (Sighting) ← 用户众包内容:时间+地点+照片
```
**Model(车型)核心字段**(统一字段表,跨分类通用 + 分类专有)
- 通用:型号、别名、分类、系列、生产商、**制造国/地区**、**国别属性(国产/进口/引进仿制/中外合资)**、首产年、停产年、状态、用途、产量、缩略图
- 尺寸/重量:车长、车宽、车高、整备重量、轴重、轴距、轴列式
- 动力:牵引力(起动/持续)、最高时速、供电方式、传动方式、动力来源
- 关系:父型号(改型自)、衍生型号(构成"族谱")、**原型车/技术来源(指向国外车型,如 8K↔法国、ND 系列↔进口内燃)**
**Unit(车辆个体)字段**:车号、所属车型、配属路局、涂装、当前状态(现役/封存/报废/保存于博物馆)、首次/末次目击。
**Sighting(目击/打卡)字段**:用户、车辆、时间、地点(经纬度+车站)、照片、描述。
> 字段命名、单位统一在数据字典中维护,所有数值字段拆出独立"数值 + 单位"避免现表的混排问题。
---
## 4. 展示模式(既有趣又科学)
不押注单一视图,而是提供**多视图切换**,让不同诉求的人各取所需。
### 4.1 时间轴视图 ⭐ 推荐主视图
- 横轴为年代(1881 至今),按分类分泳道。
- 每个车型是轴上一个节点,点击展开详情卡。
- 适合呈现"蒸汽→内燃→电力→动车组"的技术演进,**科学感与故事性兼具**。
### 4.2 地图视图 ⭐ 推荐
- 两种用法:
- **配属地图**:按路局展示车型分布(适合机车/检测车)。
- **目击热力图**:聚合用户打卡记录,展示"哪里能拍到什么车"——这是社区活跃度的可视化,趣味性极强。
- 技术:MapLibre / 高德地图,聚合点 + 热力图。
### 4.3 技术族谱图(谱系树)⭐ 差异化亮点
- 用有向图展示车型演化(如 韶山系列、和谐号→复兴号、C 系列敞车改型)。
- 节点=车型,连线=改进/衍生关系。最能体现"科学"且独此一家。
### 4.4 图鉴/卡牌视图
- 类似宝可梦图鉴的卡片墙,按分类筛选,带"已收集/未收集"状态(结合打卡)。
- 是趣味性与收集欲的核心载体。
### 4.5 参数对比视图
- 勾选 2–4 个车型,雷达图/对比表并排比较(时速、牵引力、轴重等)。
- 满足"硬核党"的科学需求。
### 4.6 详情页
- 集成:参数表、历史沿革、图集、族谱位置、目击地图、相关讨论。
**结论**:以 **时间轴 + 图鉴卡牌** 为日常入口,**地图 + 族谱 + 对比** 为深度探索,兼顾趣味与科学。
---
## 5. 众包维护机制(让爱好者有荣誉感)
核心思路:**Wiki 式协作编辑 + 审核 + 贡献激励**。
### 5.1 编辑与审核流程
- 任何登录用户可对车型发起"编辑建议"(修改字段、补充资料、上传图片)。
- 采用 **修订版本(Revision** 机制:每次修改生成版本记录,可对比、可回滚(类似维基百科历史)。
- 审核分级:
- 新手编辑 → 进入审核队列,由资深用户/版主复核。
- 高信誉用户 → 可直接生效(信任分机制)。
- 每条字段可附**来源引用**(书籍、铭牌照片、官方资料),保障科学性。
### 5.2 荣誉与激励体系
- **贡献积分**:新增车型、补全字段、上传被采用的照片、通过审核均得分。
- **等级与头衔**:如"见习巡道员 → 司炉 → 司机 → 机务段长 → 总工程师"(铁路主题化)。
- **徽章成就**:首张照片、集齐某分类、连续打卡、被采纳 N 次修订等。
- **贡献榜**:周榜/月榜/总榜,详情页显示"本词条主要贡献者"署名——**直接给到荣誉感**。
- **认领词条**:资深爱好者可"认领维护"某车型,成为该词条 maintainer,署名上墙。
### 5.3 数据质量保障
- 字段校验(数值范围、单位、年代逻辑)。
- 争议字段可发起讨论投票。
- 完整修订历史,任何错误可追溯、可回滚。
---
## 6. 社区交流(保留交流历史)
### 6.1 论坛/板块
- 按分类、路局、主题(拍车/模型/历史考证)分板块。
- 帖子、回复、@、点赞、收藏,**全部持久化保存,永久可查**(满足"保留交流历史")。
### 6.2 词条挂讨论
- 每个车型/个体详情页内嵌讨论区,讨论与数据绑定沉淀。
### 6.3 打卡动态流
- 用户上传目击照片形成 Feed,可评论互动——把"维护数据"和"社交"融为一体。
### 6.4 内容沉淀
- 优质考证帖可被"精华化"并引用进词条来源,形成 UGC → 知识库的正循环。
---
## 7. 其他扩展(建议)
| 方向 | 说明 |
|------|------|
| 📷 **打卡集邮** | 拍到某车号即"收集",类似观鸟/集邮,强收集欲 |
| 🗺️ **拍车攻略** | 基于目击热力图,推荐"在哪个站点能拍到什么车" |
| 🏛️ **退役/保存机车地图** | 标注各博物馆、公园保存的实车位置,便于线下打卡 |
| 🔔 **稀有车提醒** | 关注某车型,有新目击时推送 |
| 🧠 **AI 识车** | 上传照片自动识别车型(长期,基于社区图库训练) |
| 📊 **数据可视化大屏** | 全国保有量、技术演进、时速变迁等科普图表 |
| 🎮 **AR/3D 模型** | 部分经典车型 3D 展示或 AR 摆放 |
| 🌐 **开放 API / 数据导出** | 开放数据集供研究者使用,强化"科学开放"形象 |
| 🌍 **多语言** | 面向海外铁道迷 |
---
## 8. 国外车型的考量
**当前方案以中国机车为中心,但国外车型不应被忽略**——原因是二者高度交织:
- **历史渊源**:建国前蒸汽机车多为进口/外国制造(美、日等);建国后大量引进苏联、东欧、法国(8K 电力机车)、日本等机型,形成"**引进 → 仿制 → 自主**"的清晰技术脉络。
- **强化族谱视图**:把国外原型车纳入后,技术族谱图能完整呈现"原型 → 引进 → 国产化 → 自主升级"链条,科学性和故事性都更强。
### 范围策略(按相关性分圈层收敛,避免范围失控)
| 圈层 | 范围 | 优先级 |
|------|------|--------|
| 🟢 圈层一 | 中国铁路车型(现有数据) | MVP,立即做 |
| 🟡 圈层二 | **在华运用过的外国车型** + **中国车型的国外原型/技术来源** | 中期,价值最高 |
| 🔵 圈层三 | 与中国有渊源的延伸(如出口机车、同平台海外型号) | 长期 |
| ⚪ 圈层四 | 纯国外车型全球图鉴 | 视社区意愿再定,谨慎扩张 |
### 设计要点
- 数据模型已预留**制造国/地区、国别属性、原型车/技术来源**字段,从一开始就为国外车型留好位置,无需后期重构。
- 展示上增加"**按国别筛选**"和"**世界地图**"维度;族谱图跨国连线。
- **建议**:先做好圈层一、二(与中国强相关的部分),这是差异化价值所在;是否扩到圈层四交给社区共建决定,而非一开始铺开全球数据。
### 注意事项
- 国外资料的**来源与版权**更需谨慎(多语言资料、图片授权)。
- 字段需国际化(单位、命名、轴列式 UIC 标准 vs 中国习惯)。
- 防止范围蔓延导致中国部分的深度被稀释——**深度优先于广度**。
---
## 9. 技术架构建议
**前端**
- Web 优先(响应式),后续 App。框架:React / Next.js(SEO 友好,利于百科被搜索到)。
- 可视化:时间轴/族谱用 D3 或 ECharts,地图用 MapLibre/高德,对比用 ECharts 雷达图。
**后端**
- APINode.js(NestJS) 或 Python(FastAPI)。
- 数据库:PostgreSQL(结构化车型数据 + PostGIS 处理地理目击数据)。
- 全文检索:Meilisearch / Elasticsearch(中文搜索)。
- 对象存储:图片/图集(OSS / S3)。
- 缓存:Redis。
**关键工程**
- **数据导入管线**:先做一个 Excel → 清洗 → 入库 的 ETL 脚本(处理合并单元格、单位拆分、字段映射),把现有 12 表作为初始种子数据。
- **版本/审核服务**:修订记录、diff、回滚。
- **权限与信誉系统**:RBAC + 贡献积分。
---
## 10. 分期路线图(MVP 优先)
**Phase 1 · 数据底座(MVP**
- Excel 清洗入库,统一字段字典。
- 车型列表 + 详情页 + 搜索筛选。
- 时间轴视图、图鉴卡牌视图。
**Phase 2 · 众包共建**
- 登录注册、Wiki 式编辑 + 审核 + 修订历史。
- 贡献积分、等级、徽章、贡献榜。
**Phase 3 · 社区与空间**
- 论坛 + 词条讨论 + 打卡动态流。
- 地图视图(配属 + 目击热力图)。
**Phase 4 · 进阶玩法 + 圈层扩展**
- 族谱图、参数对比、保存机车地图、稀有车提醒。
- 接入圈层二:在华运用的外国车型 + 中国车型的国外原型,跨国族谱连线。
**Phase 5 · 智能化**
- AI 识车、数据大屏、开放 API、AR/3D。
---
## 11. 风险与注意事项
- **数据版权与来源**:众包内容需标注来源,图片需声明授权,避免侵权。
- **数据准确性**:以"来源引用 + 审核 + 可回滚"对冲错误;争议字段公开讨论。
- **冷启动**:先邀请核心爱好者圈子共建种子内容与首批 maintainer。
- **审核成本**:信誉分越高审核越宽松,平衡质量与活跃度。
- **隐私与合规**:目击地点等 UGC 注意敏感区域与合规要求。
---
## 12. 小结
以现有 12 张分类表为种子,构建"**车型→个体→目击**"三层数据模型;用**时间轴 + 图鉴 + 地图 + 族谱**多视图兼顾趣味与科学;以 **Wiki 式协作 + 信誉荣誉体系**驱动众包维护;用**论坛 + 词条讨论 + 打卡动态**沉淀社区交流历史。建议从数据底座 MVP 起步,逐步叠加共建、社区与智能化能力。