这是一个书。想象分解数千份同一本书,然后尝试重新组装和阅读故事——研究人员描述了问题的规模庞大的基因组解码的松果体Taeda或火炬松。

“这是一个巨大的基因组。但面临的挑战不仅仅是收集所有的序列数据。问题是装配序列到秩序,”大卫·尼尔教授说,植物科学的加州大学。他带领火炬松基因组项目。

作为导演的火炬松基因组组装团队,Steven Salzberg医学和生物统计学教授约翰·霍普金斯大学有相同的情绪。“我们能够组装人类基因组,但这是接近我们的能力的限制;七倍只是太多,”他承认。

遗传学家最后解码的团队利用单倍体的DNA和新颖的组装策略。“我们开发一种新型的战略火炬松的基因组序列相结合的独特方面松生殖生物学和基因组组装方法,”他们研究说。

完成经过拟合起来160亿单独的片段称为基因组组装的计算难题。看来火炬松的基因组是人类基因组大小的7倍,而迄今为止成为有史以来最大的和最完整的针叶树基因组测序出版。

火炬松基因组的原因被大点满的外来DNA元素使基因组本身的副本。从他们的发现,这样的副本和其他重复序列片段组成大约82%的基因组。

这是第一次大审判的马里兰大学的研究人员开发的一种新的分析方法。现在,他们可以通过压缩快车道基因组组装的原始序列数据100倍。这也将帮助科学家在培育更发达的品种以及理解植物的进化和多样性。

报道称,火炬松是商业上最重要的是发现在美国的树种,主要是大多数纸产品的来源。它也可能很快成为生物燃料原料开发更多的研究。

美国农业部主管的国家食品与农业研究所(NIFA),桑尼Ramaswamy,表达了很高的期望在研究。“既然我们已经解锁它的遗传秘密,火炬松将承担更大的重要性,我们寻找新的生物质来源推动我国的bioeconomy和增加碳封存和减轻气候变化的方法。”

“我为研究小组努力工作真正代表了科学需要带来解决我们的一些最大的挑战,”Ramaswamy补充道。

研究所的NIFA资助研究说。研究者的科学论文的草稿基因组出现在遗传学和基因组生物学》杂志上。

ⓒ2023 T万博体育登录首页ECHTIMES.com保留所有权利。不复制未经许可。