# 03 Genotyping 开发录入说明 来源:`docs/architecture/03-genotyping-data-flow.md` 本目录按 Genotyping 模块的数据录入顺序拆分开发说明。主线是: ```text Core/Phenotyping 上游数据 -> plate / sample reference_set -> reference -> reference_bases reference_set + study -> variantset -> variant sample -> callset callset + variantset -> callset_variant_sets callset + variant -> allele_call genome_map -> linkageGroup/linkage_group -> marker_position -> variant ``` ## 文档清单 | 顺序 | 文档 | 表 | 作用 | | --- | --- | --- | --- | | 01 | `01-plate.md` | `plate` | 样本板 | | 02 | `02-sample.md` | `sample` | 送检样本/测序样本 | | 03 | `03-reference_set.md` | `reference_set` | 参考基因组集合 | | 04 | `04-reference.md` | `reference` | 参考序列 | | 05 | `05-reference_bases.md` | `reference_bases` | 参考序列片段/分页 | | 06 | `06-variantset.md` | `variantset` | 变异集合 | | 07 | `07-variant.md` | `variant` | 变异位点 | | 08 | `08-callset.md` | `callset` | 样本调用集合 | | 09 | `09-allele_call.md` | `allele_call` | genotype 调用结果 | | 10 | `10-genome_map.md` | `genome_map` | 遗传图谱 | | 11 | `11-linkage_group.md` | `linkageGroup` / `linkage_group` | 连锁群 | | 12 | `12-marker_position.md` | `marker_position` | marker/variant 图谱位置 | | 13 | `13-callset_variant_sets.md` | `callset_variant_sets` | callset 与 variantset 关系 | | 14 | `14-variantset_analysis.md` | `variantset_analysis` | variantset 分析信息 | | 15 | `15-variantset_format.md` | `variantset_format` | variantset 可用文件/矩阵格式 | ## 全局注意点 1. `CallEntity` 对应真实业务表是 `allele_call`,不要新建 `call` 表。 2. `CallSetEntity` 对应 `callset`,不是 `call_set`。 3. `VariantSetEntity` 对应 `variantset`,不是 `variant_set`。 4. 架构文档标注 `LinkageGroupEntity` 的表名为 `linkageGroup`;当前初始 DDL 中表名为 `linkage_group`。做迁移前必须以实际数据库 catalog 为准。 5. `sample` 是 Genotyping 样本入口,向上关联 `plate/observation_unit/study/trial/program`。 6. `variant` 是位点定义,`allele_call` 是某个样本/callset 在位点上的结果。 7. `reference_set/reference/reference_bases` 是参考基因组侧;`variantset/variant/callset/allele_call` 是变异和结果侧。