# Germplasm 与 Seed 数据流及表关系 本文档整理 Germplasm 模块中以 `germplasm` 为核心,并覆盖 SeedLot、CrossingProject、GermplasmAttribute、Cross、Pedigree 等相关表的关系。重点表包括: ```text germplasm seed_lot seed_lot_content_mixture crossing_project cross_entity / planned cross / cross_parent germplasm_attribute_definition germplasm_attribute_value pedigree_node / pedigree_edge breeding_method ``` ## 结论 Germplasm 关系主线可以理解为: ```text breeding_method -> germplasm -> germplasm_attribute_value -> germplasm_attribute_definition program -> crossing_project -> cross_entity -> cross_parent -> germplasm germplasm / cross_entity -> seed_lot_content_mixture -> seed_lot germplasm -> pedigree_node -> pedigree_edge ``` 其中 `plannedcross` 在数据库中不是独立表,而是 `cross_entity` 的自关联:`cross_entity.planned_cross_id -> cross_entity.id`,并通过 `planned` 字段区分计划杂交和实际杂交。 ## 图 4 Germplasm 关系架构图 ```mermaid flowchart TD BM["breeding_method
育种方法"] -->|"breeding_method_id"| G["germplasm
种质主表"] CROP["crop
作物"] -->|"crop_id"| G GAD["germplasm_attribute_definition
GermplasmAttribute 定义"] -->|"attribute_id"| GAV["germplasm_attribute_value
GermplasmAttributeValue"] G -->|"germplasm_id"| GAV CROP -->|"crop_id"| GAD TR["trait"] -->|"trait_id"| GAD ME["method"] -->|"method_id"| GAD SC["scale"] -->|"scale_id"| GAD ONT["ontology"] -->|"ontology_id"| GAD PR["program
项目"] -->|"program_id"| CP["crossing_project
CrossingProject"] CP -->|"crossing_project_id"| CR["cross_entity
Cross / PlannedCross"] CP -->|"crossing_project_id"| XP["cross_parent
CrossParent"] CR -->|"cross_id"| XP G -->|"germplasm_id"| XP OU["observation_unit
可选亲本来源"] -->|"observation_unit_id"| XP CR -->|"planned_cross_id 自关联"| PCR["cross_entity
planned cross"] G -->|"germplasm_id"| SCM["seed_lot_content_mixture
SeedLot 组成"] CR -->|"cross_id"| SCM SCM -->|"seed_lot_id"| SL["seed_lot
SeedLot"] PR -->|"program_id"| SL LOC["location
库位/地点"] -->|"location_id"| SL SL -->|"from_seed_lot_id"| TX["seed_lot_transaction
SeedLot 流转"] TX -->|"to_seed_lot_id"| SL CP -->|"crossing_project_id"| PN["pedigree_node
PedigreeNode"] G -->|"germplasm_id"| PN PN -->|"this_node_id"| PE["pedigree_edge
亲子/同胞关系"] PE -->|"connceted_node_id"| PN2["pedigree_node
父本/子代节点"] ``` ## 图 4-2 Germplasm ER 关系图 ```mermaid erDiagram crop ||--o{ germplasm : "crop_id" breeding_method ||--o{ germplasm : "breeding_method_id" germplasm ||--o{ germplasm_attribute_value : "germplasm_id" germplasm ||--o{ germplasm_donor : "germplasm_id" germplasm ||--o{ germplasm_institute : "germplasm_id" germplasm ||--o{ germplasm_origin : "germplasm_id" germplasm ||--o{ germplasm_synonym : "germplasm_id" germplasm ||--o{ germplasm_taxon : "germplasm_id" germplasm ||--o| pedigree_node : "germplasm_id" pedigree_node ||--o{ pedigree_edge : "this_node_id" pedigree_node ||--o{ pedigree_edge : "connceted_node_id" crossing_project ||--o{ cross_entity : "crossing_project_id" cross_entity ||--o{ cross_entity : "planned_cross_id" cross_entity ||--o{ cross_parent : "cross_id" crossing_project ||--o{ cross_parent : "crossing_project_id" germplasm ||--o{ cross_parent : "germplasm_id" seed_lot ||--o{ seed_lot_content_mixture : "seed_lot_id" germplasm ||--o{ seed_lot_content_mixture : "germplasm_id" cross_entity ||--o{ seed_lot_content_mixture : "cross_id" location ||--o{ seed_lot : "location_id" program ||--o{ seed_lot : "program_id" seed_lot ||--o{ seed_lot_transaction : "from_seed_lot_id" seed_lot ||--o{ seed_lot_transaction : "to_seed_lot_id" ``` ## 核心表说明 | 表 | 作用 | 主要上游依赖 | 主要下游 | | --- | --- | --- | --- | | `germplasm` | 种质主表,保存 accession、PUI、物种、采集来源、种子来源等信息 | `crop`, `breeding_method` | 属性、机构、来源、系谱、SeedLot 组成、Cross 亲本 | | `breeding_method` | 育种方法字典 | 无 | `germplasm` | | `germplasm_attribute_definition` | GermplasmAttribute 定义,继承变量定义体系,可关联 trait/method/scale/ontology/crop | `crop`, `trait`, `method`, `scale`, `ontology` | `germplasm_attribute_value` | | `germplasm_attribute_value` | GermplasmAttributeValue,保存某个 germplasm 在某个属性上的取值 | `germplasm`, `germplasm_attribute_definition` | 属性查询 | | `crossing_project` | CrossingProject,杂交项目 | `program` | `cross_entity`, `cross_parent`, `pedigree_node` | | `cross_entity` | Cross/PlannedCross 统一落库表;`planned_cross_id` 是对本表的自关联 | `crossing_project`, `cross_entity` | `cross_parent`, `seed_lot_content_mixture` | | `cross_parent` | CrossParent,连接 `cross_entity` 与 `germplasm` 或 observation unit | `cross_entity`, `crossing_project`, `germplasm`, `observation_unit` | 杂交亲本 | | `seed_lot` | 种子批次/库存批次,保存数量、单位、库位、项目、创建和更新时间 | `location`, `program` | `seed_lot_content_mixture`, `seed_lot_transaction` | | `seed_lot_content_mixture` | SeedLot 组成明细,连接 `seed_lot` 与 `germplasm` 或 `cross_entity` | `seed_lot`, `germplasm`, `cross_entity` | 表示批次内各成分占比 | | `seed_lot_transaction` | SeedLot 流转记录,记录从一个批次到另一个批次的数量变化 | `from_seed_lot`, `to_seed_lot` | 库存流向追踪 | | `pedigree_node` | 系谱节点,一个节点可关联一个 germplasm | `germplasm`, `crossing_project` | `pedigree_edge` | | `pedigree_edge` | 系谱边,描述 parent/child/sibling 关系 | `pedigree_node` | 系谱查询 | ## 建议录入顺序 1. 先录入上游基础数据:`crop`、`breeding_method`、`program`、`location`,以及属性定义需要的 `trait/method/scale/ontology`。 2. 录入 `germplasm_attribute_definition`,定义可采集的 GermplasmAttribute。 3. 录入 `germplasm` 主数据,并通过 `breeding_method_id` 关联育种方法。 4. 录入 `germplasm_attribute_value`,把 germplasm 与 attribute definition 连接起来并保存具体值。 5. 如果涉及杂交,录入 `crossing_project`,再录入计划杂交/实际杂交到 `cross_entity`;计划杂交通过 `planned=true` 或 `planned_cross_id` 自关联体现。 6. 录入 `cross_parent`,把 cross 与 parent germplasm 或 observation unit 关联起来。 7. 录入 `pedigree_node` 和 `pedigree_edge`,表达 germplasm 的 parent/child/sibling 系谱关系。 8. 录入 `seed_lot`,保存批次数量、单位、库位和项目归属。 9. 录入 `seed_lot_content_mixture`,把 seed lot 与一个或多个 `germplasm`/`cross_entity` 连接起来。 10. 后续出入库、分装、合并或转移时,录入 `seed_lot_transaction`,通过 `from_seed_lot_id` 与 `to_seed_lot_id` 追踪流向。 ## 关键注意点 1. `germplasm.seedSource` 和 `germplasm.seedSourceDescription` 是种质主表上的描述字段,不等同于库存批次。 2. 真正表示库存批次的是 `seed_lot`,而批次与种质的关系在 `seed_lot_content_mixture` 中。 3. `seed_lot_content_mixture` 可以关联 `germplasm`,也可以关联 `cross_entity`,适合表达混合种子批次或由杂交产生的批次。 4. `seed_lot_transaction` 同时有 `fromSeedLot` 与 `toSeedLot`,因此它表达的是 seed lot 到 seed lot 的流转关系,而不是 seed lot 到 germplasm 的直接关系。 5. `plannedcross` 没有独立数据库表,统一使用 `cross_entity`,通过 `planned` 字段和 `planned_cross_id` 自关联表达。 6. `germplasm_attribute_definition` 是属性定义,`germplasm_attribute_value` 是种质上的实际属性值,两者通过 `attribute_id` 连接。 7. 系谱关系由 `pedigree_node` 和 `pedigree_edge` 表达;杂交流程由 `cross_entity` 和 `cross_parent` 表达,两者都可以回到 `germplasm` 主数据。