名称描述内容

世界上最大的人类基因组序列向科学家开放

英国生物银行近日公布了对其50万参与者进行全基因组测序的令人难以置信的新数据。这个数据库公布 50 万名英国志愿者的每一个人的完整基因组序列。全世界的研究人员都可以申请访问这些去标识化数据,并利用它们来探究健康和疾病的遗传基础。

 

这将推动新的诊断方法、治疗方法和治愈方法的进步,并通过一个包含去标识化数据(例如姓名、地址、出生日期、全科医生姓名等)的受保护数据库,提供给世界各地经批准的研究人员。如此丰富的基因组数据是无与伦比的,但它与英国生物银行在过去15年中收集的生活方式、全身成像扫描、健康信息和血液中发现的蛋白质等现有数据的结合,才是其成为医疗保健未来的决定性因素。

 

继2021年发布20万名生物银行参与者的全基因组之后,今天的大手笔发布了每位英国生物银行参与者的30亿个字母的完整基因组序列。这项耗资2亿英镑(约合2.5亿美元)的工作由生物医学研究资助者Wellcome、英国政府和几家制药公司共同资助,作为回报,这些公司可以在数据发布前9个月获取数据。

 

英国生物银行首席执行官Rory Collins在新闻发布会上说:"科学家们正在像研究谷歌地图一样研究这些数据。当他们想知道从生活方式、环境、遗传到疾病的途径是什么时,他们不会去谷歌,而是会去英国生物银行"。

 

罕见变异

在此之前,英国生物银行的基因信息包括整个 "外显子组",每个外显子组都是基因组中负责编码蛋白质的 2%,以及分布在基因组中的 85 万个常见的单字母 DNA 变异。全基因组关联研究(GWAS)将健康与遗传学联系在一起。

 

但是,当研究人员寻找遗传与疾病或其他性状之间的关联时,这些 "命中 "的变异大多出现在基因组的非编码区,而这些非编码区在外显子组序列中是缺失的,在现有的全基因组数据中也只有低分辨率的覆盖。英国埃克塞特大学人类遗传学家Michael Weedon说,全基因组还能让研究人员发现非常罕见的变异,这些变异对性状的影响往往比全基因组数据中的常见变异更大。"我们希望稀有变异能让我们更深入地了解生物学。

 

事实已经证明了这一点。在11月20日的预印本中,由Weedon和同在埃克塞特大学的人类遗传学家Gareth Hawkes领导的研究小组对英国生物库数据中的前20万个完整基因组进行了挖掘,发现了29个罕见的DNA变体,这些变体与高达7厘米的身高差异有关;这些变体在以前的遗传研究中从未发现过。Weedon说,这项研究是对所有 50 万个基因组进行分析的试点,他计划进一步对基因组数据进行初步研究。

 

最终,研究人员将需要50万个以上的全基因组来全面绘制罕见基因变异与健康之间的关联图。"我认为这是获得我们可能需要的数百万个样本的良好的下一步"。

 

更有针对性的药物发现和开发。根据人类遗传学证据开发的实验性疗法获准用于临床的可能性要高出一倍!"这个具有里程碑意义的数据集将使我们能够利用人工智能和机器学习的力量,快速确定新的疾病靶点,并帮助研究人员预测候选药物如何根据患者的遗传学影响某些亚群患者。这将为更高效的临床开发铺平道路,并推动精准医学的发展,"强生公司创新医学研发执行副总裁、医学博士 John Reed 说。

 

发现数千种致病的非编码基因变异

 

人类基因组的98%曾经被错误地称为“垃圾DNA”,人们对它们知之甚少。这是DNA中不编码蛋白质的部分,利用早期的测序数据,一项研究已经从这个区域发现了罕见变异与特定基因决定特征相关的例子。

 

加快推进精准医疗。英国生物银行的样本量为50万人,收集了超过1万个变量(如血压、认知功能、饮食和骨密度)的数据,研究人员正在推动量身定制的医疗保健,比如调查为什么具有相同遗传倾向的人对同一种疾病有不同的结果、反应和副作用。

 

了解疾病的生物学基础。对于许多疾病,如帕金森氏症、阿尔茨海默氏症和自身免疫性疾病,人们对其潜在的起源知之甚少。"这个突破性的数据集让科学家们能够比以往任何时候都更近距离地探索遗传如何影响蛋白质、代谢物和其他生理因素的水平,有望加速我们对疾病遗传基础的理解。“安进公司研发执行副总裁David Reese说。

 

英国生物银行网址:https://www.ukbiobank.ac.uk/


论文原文:

doi:https://doi.org/10.1038/d41586-023-03763-3