单倍型解析基因组组装和重测序分析为赤松的基因组进化和等位基因失衡提供见解
文章题目:Haplotype-resolved genome assembly and resequencing analysis provide insights into genome evolution and allelic imbalance in Pinus densiflora
发表时间:2024年10月
发表期刊:Nature Genetics
组学技术:单倍型基因组+群体重测序
研究结果:
1. 赤松单倍型基因组组装与注释
研究者构建了赤松两套单倍型基因组(HA:21.73Gb,HB:21.75Gb),并成功挂载至12条染色体。注释结果显示,HA与HB中分别包含44233和44215个蛋白编码基因。与P. tabuliformis(23.8 Gb)、P. taeda和P. lambertiana基因组比较,发现P. tabuliformis与HA(20.7 Gb)对齐比例最高(94%),基因组大小差异约3.1 Gb,而P. taeda和P. lambertiana对齐比例分别为68%-70%和34%-37%,表明P. densiflora与P. tabuliformis差异更大。P. tabuliformis的9号染色体存在重复,且HA与P. tabuliformis的1号和3号染色体间存在重排,遗传标记分析显示P. taeda与赤松的1号和3号染色体短臂结构相对保守但发生转位。综上,1号和3号染色体重排促进了松属基因组大小与结构的变化。
图2 赤松单倍型(HA)和(HB)基因组特征
2. LTR-RTs和TFs推动松属基因组的进化
赤松基因组含有约13.1 Gb的LTR-反转录转座子(LTR-RTs),占总基因组的60%,gypsy和copia元素分别占44%和16%,它们在松属基因组的扩张中扮演了关键角色。LTR-RTs的特定亚群在松属中显著富集,且gypsy亚群在近几百万年内迅速扩增,而copia亚群在较早时期积累。此外,LTR-RTs亚群的分布与基因组的基因丰富区和贫乏区存在明显关联,推动了松属基因组的多样化和扩展。
图3 LTR-RTs驱动赤松基因组进化
通过比较赤松与其他被子植物和裸子植物的转录因子(TF)家族,发现赤松及其他松属物种的TF家族显著扩展,尤其是与疾病抗性和调控相关的保守结构域基因。这些基因与转座子有良好的共定位关系,表明转座子促进了这些基因的演化和扩展。赤松中的TF数量明显高于其他松属物种,提示需更新其他松属物种的TF注释,以深入理解松属基因组中的TF多样性和演化。
图4保守结构域(TD)和LTR介导的转录因子在赤松中显著扩张
3. HA与HB中的等位基因差异分析
在赤松的HA与HB单倍型中,研究者分别鉴定出915720和937699个变异,涵盖31277和31243个基因。其中,部分基因在一个单倍型中存在而在另一个中缺失,这些缺失直接影响植物表型;同时,某些插入事件在某一单倍型中独有,可能赋予新功能或特性。HA与HB间SNP丰富,影响基因表达与功能。等位基因的缺失与插入直接影响赤松的生理特性,如开花时间、果实发育及抗逆境能力,且HA可能在特定环境条件下更具适应能力。对转录因子的比较揭示,HA与HB在基因表达调控上存在差异,导致对环境变化的响应不同。基于重测序数据,研究者发现赤松中存在丰富的等位基因变异,为其在多变环境中的生存与繁殖提供了遗传基础,表明等位基因变异与自然选择密切相关,适应性强的单倍型在特定环境中具有优势。
图5 30个赤松样本中等位基因和PAV基因的多样性
总结:
本研究构建了首个高连续性、基因注释准确的松属单倍型基因组,深入探讨了基因组重复、染色体重排及LTR-RTs特定亚群扩展对赤松基因组大小与结构多样性的影响。通过更新注释,对松属、裸子及被子植物的TF家族进行了比较,揭示了赤松中TF家族的显著扩张及其进化模式。同时,基于亚基因组间的等位基因分析,本研究还阐明了单倍型间等位基因的不平衡状态及其在调控密草树开花及非生物抗逆性等性状中的功能作用。综上所述,本研究为松属及裸子植物的基因组进化与单倍型研究提供了宝贵见解。
参考文献:
[1] Jang M J , Cho H J , Park Y S ,et al.Haplotype-resolved genome assembly and resequencing analysis provide insights into genome evolution and allelic imbalance in Pinus densiflora[J].Nature Genetics, 2024, 56(11):30.DOI:10.1038/s41588-024-01944-y.