2.3 KiB
2.3 KiB
03 Genotyping 开发录入说明
来源:docs/architecture/03-genotyping-data-flow.md
本目录按 Genotyping 模块的数据录入顺序拆分开发说明。主线是:
Core/Phenotyping 上游数据 -> plate / sample
reference_set -> reference -> reference_bases
reference_set + study -> variantset -> variant
sample -> callset
callset + variantset -> callset_variant_sets
callset + variant -> allele_call
genome_map -> linkageGroup/linkage_group -> marker_position -> variant
文档清单
| 顺序 | 文档 | 表 | 作用 |
|---|---|---|---|
| 01 | 01-plate.md |
plate |
样本板 |
| 02 | 02-sample.md |
sample |
送检样本/测序样本 |
| 03 | 03-reference_set.md |
reference_set |
参考基因组集合 |
| 04 | 04-reference.md |
reference |
参考序列 |
| 05 | 05-reference_bases.md |
reference_bases |
参考序列片段/分页 |
| 06 | 06-variantset.md |
variantset |
变异集合 |
| 07 | 07-variant.md |
variant |
变异位点 |
| 08 | 08-callset.md |
callset |
样本调用集合 |
| 09 | 09-allele_call.md |
allele_call |
genotype 调用结果 |
| 10 | 10-genome_map.md |
genome_map |
遗传图谱 |
| 11 | 11-linkage_group.md |
linkageGroup / linkage_group |
连锁群 |
| 12 | 12-marker_position.md |
marker_position |
marker/variant 图谱位置 |
| 13 | 13-callset_variant_sets.md |
callset_variant_sets |
callset 与 variantset 关系 |
| 14 | 14-variantset_analysis.md |
variantset_analysis |
variantset 分析信息 |
| 15 | 15-variantset_format.md |
variantset_format |
variantset 可用文件/矩阵格式 |
全局注意点
CallEntity对应真实业务表是allele_call,不要新建call表。CallSetEntity对应callset,不是call_set。VariantSetEntity对应variantset,不是variant_set。- 架构文档标注
LinkageGroupEntity的表名为linkageGroup;当前初始 DDL 中表名为linkage_group。做迁移前必须以实际数据库 catalog 为准。 sample是 Genotyping 样本入口,向上关联plate/observation_unit/study/trial/program。variant是位点定义,allele_call是某个样本/callset 在位点上的结果。reference_set/reference/reference_bases是参考基因组侧;variantset/variant/callset/allele_call是变异和结果侧。