# 中国机车图鉴 · 产品与技术方案 > 一个面向铁路爱好者的、可众包维护的机车知识库与社区平台 > 数据基础:`中国铁路车型统计表(总表)` 共 12 张分类表 --- ## 1. 项目愿景 打造一个**「科学严谨 + 趣味探索 + 社区共建」**的中国机车数字图鉴: - 对爱好者:一个能"逛得进去、查得明白、玩得起来"的机车百科 + 打卡社区。 - 对数据:一份持续生长、有据可查、版本可追溯的开放车型数据库。 - 对社区:一个有荣誉感、有归属感、有交流沉淀的爱好者聚集地。 一句话定位:**机车界的「维基百科 + 观鸟记录 App + 兴趣社区」**。 --- ## 2. 数据现状分析 现有 Excel 已覆盖 12 个分类,字段相当完整,是天然的"数据底座"。 | 分类 | 代表字段 | 数据特征 | |------|----------|----------| | 蒸汽机车(建国前/后) | 型号、生产商、年代 | 历史向,强时间轴属性 | | 电力机车 | 牵引力、供电方式、轴列式、时速 | 技术参数密集 | | 内燃机车 | 系列、传动方式、动力来源 | 有"系列→型号"层级 | | 动车组(和谐号/复兴号/CJ) | 编组、节数、试验/量产状态 | 强版本/谱系关系 | | 货车 | 车型大类、车型代码、载重、容积、车钩 | 编码体系清晰 | | 客车 | 型号、用途 | 数量大 | | 检测车 / 综合检测列车 | 车号、功能、配属、状态、涂装 | 强"个体实例"属性(精确到车号) | | 旅游列车 | — | 运营/线路向 | **关键洞察:** 1. **存在两个数据粒度**——"车型(Model)"与"具体车辆个体(Unit,精确到车号)"。检测车表已经到了车号粒度,这正是众包打卡的核心载体。 2. **存在层级与谱系关系**——系列 → 型号 → 改型(如 C62A / C64K),动车组有试验型→量产型演化,适合做"技术族谱"可视化。 3. **字段需要标准化**——现表中存在合并单元格、单位混排(如"整备重量 / 轴重 /t")、空表头等问题,入库前需清洗与字段规范化。 4. **天然带时间维度与空间维度**——首产/停产年份 → 时间轴;配属路局/运营线路 → 地图。 --- ## 3. 核心数据模型 采用三层模型,兼顾科学性与众包扩展性: ``` 车型分类 (Category) └── 车型 (Model) ← 百科主体,技术参数挂这里 └── 车辆个体 (Unit) ← 精确到车号,爱好者打卡/拍摄对象 └── 目击记录 (Sighting) ← 用户众包内容:时间+地点+照片 ``` **Model(车型)核心字段**(统一字段表,跨分类通用 + 分类专有) - 通用:型号、别名、分类、系列、生产商、**制造国/地区**、**国别属性(国产/进口/引进仿制/中外合资)**、首产年、停产年、状态、用途、产量、缩略图 - 尺寸/重量:车长、车宽、车高、整备重量、轴重、轴距、轴列式 - 动力:牵引力(起动/持续)、最高时速、供电方式、传动方式、动力来源 - 关系:父型号(改型自)、衍生型号(构成"族谱")、**原型车/技术来源(指向国外车型,如 8K↔法国、ND 系列↔进口内燃)** **Unit(车辆个体)字段**:车号、所属车型、配属路局、涂装、当前状态(现役/封存/报废/保存于博物馆)、首次/末次目击。 **Sighting(目击/打卡)字段**:用户、车辆、时间、地点(经纬度+车站)、照片、描述。 > 字段命名、单位统一在数据字典中维护,所有数值字段拆出独立"数值 + 单位"避免现表的混排问题。 --- ## 4. 展示模式(既有趣又科学) 不押注单一视图,而是提供**多视图切换**,让不同诉求的人各取所需。 ### 4.1 时间轴视图 ⭐ 推荐主视图 - 横轴为年代(1881 至今),按分类分泳道。 - 每个车型是轴上一个节点,点击展开详情卡。 - 适合呈现"蒸汽→内燃→电力→动车组"的技术演进,**科学感与故事性兼具**。 ### 4.2 地图视图 ⭐ 推荐 - 两种用法: - **配属地图**:按路局展示车型分布(适合机车/检测车)。 - **目击热力图**:聚合用户打卡记录,展示"哪里能拍到什么车"——这是社区活跃度的可视化,趣味性极强。 - 技术:MapLibre / 高德地图,聚合点 + 热力图。 ### 4.3 技术族谱图(谱系树)⭐ 差异化亮点 - 用有向图展示车型演化(如 韶山系列、和谐号→复兴号、C 系列敞车改型)。 - 节点=车型,连线=改进/衍生关系。最能体现"科学"且独此一家。 ### 4.4 图鉴/卡牌视图 - 类似宝可梦图鉴的卡片墙,按分类筛选,带"已收集/未收集"状态(结合打卡)。 - 是趣味性与收集欲的核心载体。 ### 4.5 参数对比视图 - 勾选 2–4 个车型,雷达图/对比表并排比较(时速、牵引力、轴重等)。 - 满足"硬核党"的科学需求。 ### 4.6 详情页 - 集成:参数表、历史沿革、图集、族谱位置、目击地图、相关讨论。 **结论**:以 **时间轴 + 图鉴卡牌** 为日常入口,**地图 + 族谱 + 对比** 为深度探索,兼顾趣味与科学。 --- ## 5. 众包维护机制(让爱好者有荣誉感) 核心思路:**Wiki 式协作编辑 + 审核 + 贡献激励**。 ### 5.1 编辑与审核流程 - 任何登录用户可对车型发起"编辑建议"(修改字段、补充资料、上传图片)。 - 采用 **修订版本(Revision)** 机制:每次修改生成版本记录,可对比、可回滚(类似维基百科历史)。 - 审核分级: - 新手编辑 → 进入审核队列,由资深用户/版主复核。 - 高信誉用户 → 可直接生效(信任分机制)。 - 每条字段可附**来源引用**(书籍、铭牌照片、官方资料),保障科学性。 ### 5.2 荣誉与激励体系 - **贡献积分**:新增车型、补全字段、上传被采用的照片、通过审核均得分。 - **等级与头衔**:如"见习巡道员 → 司炉 → 司机 → 机务段长 → 总工程师"(铁路主题化)。 - **徽章成就**:首张照片、集齐某分类、连续打卡、被采纳 N 次修订等。 - **贡献榜**:周榜/月榜/总榜,详情页显示"本词条主要贡献者"署名——**直接给到荣誉感**。 - **认领词条**:资深爱好者可"认领维护"某车型,成为该词条 maintainer,署名上墙。 ### 5.3 数据质量保障 - 字段校验(数值范围、单位、年代逻辑)。 - 争议字段可发起讨论投票。 - 完整修订历史,任何错误可追溯、可回滚。 --- ## 6. 社区交流(保留交流历史) ### 6.1 论坛/板块 - 按分类、路局、主题(拍车/模型/历史考证)分板块。 - 帖子、回复、@、点赞、收藏,**全部持久化保存,永久可查**(满足"保留交流历史")。 ### 6.2 词条挂讨论 - 每个车型/个体详情页内嵌讨论区,讨论与数据绑定沉淀。 ### 6.3 打卡动态流 - 用户上传目击照片形成 Feed,可评论互动——把"维护数据"和"社交"融为一体。 ### 6.4 内容沉淀 - 优质考证帖可被"精华化"并引用进词条来源,形成 UGC → 知识库的正循环。 --- ## 7. 其他扩展(建议) | 方向 | 说明 | |------|------| | 📷 **打卡集邮** | 拍到某车号即"收集",类似观鸟/集邮,强收集欲 | | 🗺️ **拍车攻略** | 基于目击热力图,推荐"在哪个站点能拍到什么车" | | 🏛️ **退役/保存机车地图** | 标注各博物馆、公园保存的实车位置,便于线下打卡 | | 🔔 **稀有车提醒** | 关注某车型,有新目击时推送 | | 🧠 **AI 识车** | 上传照片自动识别车型(长期,基于社区图库训练) | | 📊 **数据可视化大屏** | 全国保有量、技术演进、时速变迁等科普图表 | | 🎮 **AR/3D 模型** | 部分经典车型 3D 展示或 AR 摆放 | | 🌐 **开放 API / 数据导出** | 开放数据集供研究者使用,强化"科学开放"形象 | | 🌍 **多语言** | 面向海外铁道迷 | --- ## 8. 国外车型的考量 **当前方案以中国机车为中心,但国外车型不应被忽略**——原因是二者高度交织: - **历史渊源**:建国前蒸汽机车多为进口/外国制造(美、日等);建国后大量引进苏联、东欧、法国(8K 电力机车)、日本等机型,形成"**引进 → 仿制 → 自主**"的清晰技术脉络。 - **强化族谱视图**:把国外原型车纳入后,技术族谱图能完整呈现"原型 → 引进 → 国产化 → 自主升级"链条,科学性和故事性都更强。 ### 范围策略(按相关性分圈层收敛,避免范围失控) | 圈层 | 范围 | 优先级 | |------|------|--------| | 🟢 圈层一 | 中国铁路车型(现有数据) | MVP,立即做 | | 🟡 圈层二 | **在华运用过的外国车型** + **中国车型的国外原型/技术来源** | 中期,价值最高 | | 🔵 圈层三 | 与中国有渊源的延伸(如出口机车、同平台海外型号) | 长期 | | ⚪ 圈层四 | 纯国外车型全球图鉴 | 视社区意愿再定,谨慎扩张 | ### 设计要点 - 数据模型已预留**制造国/地区、国别属性、原型车/技术来源**字段,从一开始就为国外车型留好位置,无需后期重构。 - 展示上增加"**按国别筛选**"和"**世界地图**"维度;族谱图跨国连线。 - **建议**:先做好圈层一、二(与中国强相关的部分),这是差异化价值所在;是否扩到圈层四交给社区共建决定,而非一开始铺开全球数据。 ### 注意事项 - 国外资料的**来源与版权**更需谨慎(多语言资料、图片授权)。 - 字段需国际化(单位、命名、轴列式 UIC 标准 vs 中国习惯)。 - 防止范围蔓延导致中国部分的深度被稀释——**深度优先于广度**。 --- ## 9. 技术架构建议 **前端** - Web 优先(响应式),后续 App。框架:React / Next.js(SEO 友好,利于百科被搜索到)。 - 可视化:时间轴/族谱用 D3 或 ECharts,地图用 MapLibre/高德,对比用 ECharts 雷达图。 **后端** - API:Node.js(NestJS) 或 Python(FastAPI)。 - 数据库:PostgreSQL(结构化车型数据 + PostGIS 处理地理目击数据)。 - 全文检索:Meilisearch / Elasticsearch(中文搜索)。 - 对象存储:图片/图集(OSS / S3)。 - 缓存:Redis。 **关键工程** - **数据导入管线**:先做一个 Excel → 清洗 → 入库 的 ETL 脚本(处理合并单元格、单位拆分、字段映射),把现有 12 表作为初始种子数据。 - **版本/审核服务**:修订记录、diff、回滚。 - **权限与信誉系统**:RBAC + 贡献积分。 --- ## 10. 分期路线图(MVP 优先) **Phase 1 · 数据底座(MVP)** - Excel 清洗入库,统一字段字典。 - 车型列表 + 详情页 + 搜索筛选。 - 时间轴视图、图鉴卡牌视图。 **Phase 2 · 众包共建** - 登录注册、Wiki 式编辑 + 审核 + 修订历史。 - 贡献积分、等级、徽章、贡献榜。 **Phase 3 · 社区与空间** - 论坛 + 词条讨论 + 打卡动态流。 - 地图视图(配属 + 目击热力图)。 **Phase 4 · 进阶玩法 + 圈层扩展** - 族谱图、参数对比、保存机车地图、稀有车提醒。 - 接入圈层二:在华运用的外国车型 + 中国车型的国外原型,跨国族谱连线。 **Phase 5 · 智能化** - AI 识车、数据大屏、开放 API、AR/3D。 --- ## 11. 风险与注意事项 - **数据版权与来源**:众包内容需标注来源,图片需声明授权,避免侵权。 - **数据准确性**:以"来源引用 + 审核 + 可回滚"对冲错误;争议字段公开讨论。 - **冷启动**:先邀请核心爱好者圈子共建种子内容与首批 maintainer。 - **审核成本**:信誉分越高审核越宽松,平衡质量与活跃度。 - **隐私与合规**:目击地点等 UGC 注意敏感区域与合规要求。 --- ## 12. 小结 以现有 12 张分类表为种子,构建"**车型→个体→目击**"三层数据模型;用**时间轴 + 图鉴 + 地图 + 族谱**多视图兼顾趣味与科学;以 **Wiki 式协作 + 信誉荣誉体系**驱动众包维护;用**论坛 + 词条讨论 + 打卡动态**沉淀社区交流历史。建议从数据底座 MVP 起步,逐步叠加共建、社区与智能化能力。