
为此,复旦大学郁金泰、程炜团队通过整合WGS与血浆代谢组数据,对涵盖5个族群约20万英国生物样本库(UKB)个体的313种代谢生物标志物的遗传结构进行了分析,构建了血浆代谢组遗传特征图谱。该研究已发表在Nature Communications上,文章题为“Analysis of whole genome sequencing and plasma metabolomics unveil genetic determinants and clinical implications for human health”。经两阶段全基因组关联荟萃分析揭示了血浆代谢组的遗传结构,其中单基因变异分析共识别出36,105个独立信号,其中22.20%为新发现;罕见变异聚合检测揭示了1,527个条件独立的蛋白质编码基因-表型组合,其中32.9%仅存在于非编码区域。通过整合空间共定位等多组学数据,研究还揭示了代谢特征与疾病之间的关联,为治疗靶点发现提供了方向指引。
研究纳入了来自199,138名UKB个体的空腹血液样本,包括欧洲、非洲、东亚、南亚和美洲5个族群,其中191,681名为欧洲血统个体。研究团队检测了血浆样本中的249种代谢生物标志物水平,共313个代谢特征。
图1.研究设计概述。
这313项代谢特征均进行了单基因变异关联分析,涵盖35,776,728个SNP位点及INDEL位点,包括7,726,466个常见变异和28,050,262个罕见变异(图2)。该分析共识别出2,072,685个显著的主要关联位点,其中966,153个得到验证,并且罕见变异可能具有更高的临床相关性。经聚类分析,在268个独立基因位点鉴定出36,105个主导信号,其中8,015个(22.20%)被确认为新发现信号,且独立于既往报道的代谢物数量性状基因位点(mQTLs);另有648个(1.79%)主要信号被视为潜在新信号。这些mQTLs主要位于非编码区域,仅4.08%对应蛋白质截短变异、错义变异、同义变异或框内变异。值得注意的是,有7个基因位点与超过200种代谢特征相关。将该结果与插补基因芯片的检测结果进行对比,显示各项分析结果高度一致。其中,该研究检测到的约50%主要信号在基于芯片的GWAS结果中并未出现。
图2.个体变异与血浆代谢组的关联概述
在基于高密度WGS数据的生物标志物关联位点的分析中,研究人员在涉及313种代谢特征的8,072个区域识别出34,377个独立信号,其中2,560个区域(31.7%)包含5个或更多信号;在可信信号集中,17,254个信号(50.2%)可精确定位于不超过5个变异位点(图3),共有12,361个独特的因果变异-表型关联。与插补芯片方法相比,基于WGS的精细定位分析在因果信号发现方面更具优势,发现了插补芯片所遗漏的潜在致病变异,并提升了精细定位分辨率。例如,在ω-3脂肪酸相关的LIPG基因位点精细定位中,插补芯片识别出1个致病变异,WGS识别出4个变异,包括罕见变异(图3f)。
图3.WGS和插补芯片对313种代谢性状的精细定位分析比较。
研究团队进一步评估了罕见变异的综合效应,共别出5,999对显著基因-性状组合(图4a)。通过与单基因变异分析中已知及新发现的常见mQTL共同分析后,鉴定出42个基因与290种代谢生物标志物存在条件性独立关联,筛选出1,527对独立于常见mQTL的基因-性状组合。其中325对组合在编码区和非编码区中均具有显著性(图4b)。值得注意的是,830个(54.3%)的综合区域未包含主导mQTL,另有421个区域(27.6%)未发现任何验证过的个体变异关联,表明这些位点可能无法被传统单基因变异分析检测到(图4c)。对于部分基因而言,非编码区域识别出的条件独立关联数量显著多于编码区域(图4i),凸显了非编码区域在调控血浆代谢中的作用。
图4.基于聚类分析与血浆代谢组的关联结果。
研究团队整合了多组学数据,包括共定位、孟德尔随机化(MR)和药物可靶向性分析,揭示了代谢特征与疾病之间的关联,并指导了治疗靶点的发现。研究识别出27,284对具有共定位证据的代谢特征-疾病组合。随后的孟德尔随机化分析确定了92种代谢性状与56种疾病之间的245种潜在因果关联(图6a)。同时,研究确定了1164种蛋白质与92种代谢特征之间,以及1267种蛋白质与56种疾病之间存在显著关联。通过优先筛选对代谢性状和临床结局具有一致影响的蛋白质,研究共识别出410个潜在靶点,为涵盖13个类别56种疾病的药物研发提供了宝贵数据,主要包括心血管疾病、代谢疾病和消化系统疾病。此外,该研究发现了重新利用现有药物靶点的潜在可能性。
该研究是迄今规模最大的基于人群的血浆代谢组WGS分析,全面揭示了人类血浆代谢组的全基因组特征。基于约20万名个体的WGS与代谢组数据,研究明确了代谢特征与临床疾病之间的潜在因果关系,有助于优先筛选具有潜力的治疗靶点。与插补芯片相比,WGS更广泛的覆盖范围显著提升了精细定位分辨率,发现了此前GWAS未能识别的众多代谢关联,为深化代谢遗传学认知提供了重要信息,也为治疗策略、潜在靶点发现、药物研发和药物再利用提供了新机遇。
原文信息:
Wang, YX., Qiang, YX., Ge, YJ. et al. Analysis of whole genome sequencing and plasma metabolomics unveil genetic determinants and clinical implications for human health. Nat Commun (2026). https://doi.org/10.1038/s41467-026-74781-8
邮政编码:200052 电话:021-63800152 传真:021-63800151 京ICP备15010734号-10 技术:网至普网站建设