2010年,人类蛋白质组组织(HUPO)启动了人类蛋白质组计划(Human Proteome Project,HPP)。该研究旨在为全球合作、数据共享、质量保证和增强基因组编码蛋白质组的准确注释创建一个框架。
2014年5月,两个国际小组均在《自然》杂志上公布了人类蛋白质组第一张草图,这些在大部分非患病人体组织和器官中表达的精选蛋白,为更好的理解疾病状态下发生的机体变化,奠定了坚实的基础。这两项最新研究揭示了人类基因组的更多复杂性,并从之前认为属于非编码区域的基因组中发现了新蛋白。
波士顿儿童医院蛋白质组学主任Hanno Steen(未参与这项研究)表示:“虽然之前其它一些大型蛋白质组数据集也收集了接近上万个蛋白数据,但是这两项成果确实是真正的突破性成果,全面覆盖了超过80%的人类预期蛋白质组,其中还有一些之前未曾被发现的蛋白。这些成果清楚地表明,想要达到这样的蛋白覆盖率深度,就需要探索许多不同的组织类型。”
来自约翰霍普金斯大学的蛋白质组研究员Akhilesh Pandey,与来自印度生物信息学研究所等处的研究人员合作,分析了30种不同的组织类型,编撰了由84%所有预期编码蛋白的人体基因翻译得到的蛋白。
这项研究识别出17, 294个蛋白编码基因,并通过表达分析证明了组织和细胞特异性蛋白的存在,并且研究人员还通过从注解的假基因、非编码RNA和未翻译的区域识别翻译的蛋白,表明了“蛋白基因组”分析的重要性。
在随后的几年中,HPP建立了合作关系,制定了指南和度量标准,并对以前保存的蛋白数据进行了重新分析,从而不断增加人类蛋白质组的覆盖范围。近日,在HPP十周年之际,该计划报告了超过90%的高质量人类蛋白质组图谱。
HPP研究团队在Nature Communications上发表了人类蛋白质组项目的最新成果。随后,人类蛋白质组组织(HUPO)也正是公布了该研究进展。报告显示,人体中90.4%的蛋白质已经被绘制出来。这是人类蛋白质组学的第一个序列草图。人们对单个蛋白质如何相互作用以影响人类健康有了更深入的理解,为疾病预防和个体化医学提供了重要见解。
UBC血液研究中心成员Overall教授表示:“这标志着我们对人类生活的全面理解有了重要的里程碑进展。虽然人类基因组计划提供了人类基因的“蓝图”,但人类蛋白质组可识别由这张“蓝图”编码的生命各个组成部分:蛋白质。蛋白质相互作用可塑造从危及生命的疾病到人体的一切细胞结构。”他指出,了解哪些蛋白质是预防疾病的关键,及其表达或活动是疾病的标志,可以为个体化医疗和新疗法的开发提供信息。
图:完成90%以上高严格人类蛋白质组。
目前,该项目研究团队已检测到人类基因组编码的19,773种蛋白质中的17,874 种。自该计划于2011年发布其首份报告以来,共增加了4,000多种蛋白质。其中,16,924个已通过质谱鉴定,另外950个已通过免疫检测等非质量标准方法进行了验证。
据悉,该项目将继续致力于鉴定其余10%的预测蛋白质,但这一过程正变得越来越困难。因为许多特殊蛋白质或者只在特定和难以获得的组织类型中表达,或者很难使用传统的蛋白质组学技术进行分离和分析。
图:人类蛋白质组计划的结构。
HPP主席Robert Moritz表示:“随着蛋白质组学研究进展放慢,蛋白质组学领域已从鉴定和分类蛋白质转移到探索其生物学功能和疾病相关性。HPP同样也正在探索蛋白质功能并开发新的研究资源。该计划的主要目标是通过提供有关如何检测蛋白质的信息,扩大研究蛋白质的数量。”
Moritz提道,目前,绝大多数研究都是针对极少数种类的蛋白质进行,因为它们很容易被检测到并且方法比较成熟。但由于许多人类疾病是由蛋白质组成或功能的变化引起的,绘制蛋白质组图可加强疾病诊断、预测结果、治疗和精准医学的理论基础,突出人类蛋白质组在癌症、心血管疾病和传染病等的诊断和治疗中发挥的潜在作用,且对于辨别健康和疾病中的分子过程至关重要。
二十年前,随着人类基因组草图的发布,人们可以利用基因组学常规地确定癌症等疾病高风险、易患性以及与肿瘤负担和复发有关的基因突变信息,也促进了多种治疗方法的发展,包括靶向疗法。但目前有效的靶向治疗仍不能适用于所有癌症。这主要是因为部分基因突变不会导致蛋白质组的变化,因此很难区分哪些变化是重要的生化驱动因素。通过整合基因组和蛋白质组学数据,可提供对疾病病因和机制的深入了解,包括癌症生物学的特征,有助于实施有效的治疗干预措施。