最大规模中国人基因库研究结果发表:汉族可分成7个亚群
最大规模中国人基因库研究结果首次发表。
4月30日,瑞金医院内分泌科领衔的ChinaMAP(中国代谢解析计划)联盟携全国29家研究机构和医院,在中科院上海生命科学研究院主办的《Cell Research》杂志首次报道了对覆盖全国27个省份和直辖市,8个民族,超过1万人的高深度全基因组测序数据和表型的系统性分析。
研究团队对队列中代表中国不同地区和民族的10588人DNA样本进行了40×深度全基因组测序,完成了高质量的中国人群遗传变异数据构建、中国人群体结构分析、基因组特征比较以及变异频谱和致病性变异解析。
此次发表意味着,通过中国人自己的仪器、平台、分析方法,对中国人的基因组特征进行深入、广泛的研究,具有前所未有的重要意义。
日本人群与中国北方汉族人群聚类完全重叠
为什么有些人喝酒脸红,为什么有些人更容易患癌?其实,这些都与体内某些特定基因有关。
长期以来,中国人的很多遗传疾病研究,都直接应用外国人的数据和结论。但由于不同地域人群和种族之间的历史渊源和遗传背景存在着巨大差异,如果把具有其他人群偏向性的知识和结论,直接拿来做为中国人的疾病风险评估、遗传咨询或诊断治疗依据,并不完善、可靠。
国家代谢性疾病临床医学研究中心(上海)基于瑞金医院牵头开展的多项覆盖全国的队列研究,依托转化医学国家重大科技基础设施(上海)和医学基因组学国家重点实验室,实施了中国代谢解析计划ChinaMAP (China Metabolic Analytics Project)。
研究覆盖中国七大地理区域,包括了人口排名前十的汉族、壮族、回族、满族、苗族、彝族、藏族和蒙古族,显示了中华民族跨地理区域人群遗传背景的多样性和复杂性。
研究团队首次揭示了汉族人群可显著分成7个亚群:北方汉族、西北汉族、东部汉族、中部汉族、南方汉族、东南汉族、和岭南汉族。
少数民族中,藏族、彝族、蒙古族、苗族和壮族都有着独特的人群聚类,而满族和北方汉族相近,回族和西北、北方汉族相近。不同地域人群的变异特征也与中国历史上的人口迁徙和变迁相关,例如河西走廊是丝绸之路中不同民族迁徙的交通要道,历史上包括粟特人等许多民族曾在此经商生活。
瑞金医院内分泌科主任王卫庆教授介绍,研究团队对队列中代表中国不同地区和民族的10588人DNA样本进行了40×深度全基因组测序,完成了高质量的中国人群遗传变异数据构建、中国人群体结构分析、基因组特征比较以及变异频谱和致病性变异解析。在ChinaMAP一期数据库中,包含1.36亿个基因多态性位点SNP和1千万个插入或缺失位点(NDEL),其中一半是在国际通用的多个数据库中均没有的新位点。
不少遗传性疾病是写在基因密码中的。疾病相关变异位点在中国人群与欧美人群中的频率存在差异,因此,中国的遗传咨询和解读,对重要性不确定的基因变异(VUS)的研究,以及相关临床指南和路径制定,需要依据中国人自己的大样本和高质量数据。
研究揭示,现代河西走廊地区的人们具有的基因多态性位点数量更多更复杂。与全世界其他人群相比,中国人的遗传特征与欧洲、非洲、南亚和拉丁美洲人群之间存在着巨大差异,与非洲人群差距最大,而与东亚人群非常相似。研究者在成分分析中发现,日本人群与中国北方汉族人群聚类完全重叠。
山东人酒量并不突出
ChinaMAP对中国人的营养代谢和药物代谢相关遗传特征也进行了分析比较。
对受到广泛关注的酒精代谢能力,从总体上看,北方人比南方人酒量相对更好,藏族、蒙古族、彝族人民和河南人酒量居于全国前列,山东人酒量并不突出,福建人和广东人排在最后。
ChinaMAP证实,导致喝酒脸红和酒精代谢能力差的乙醛脱氢酶2基因rs671变异是东亚人特异性的,在中国人群中的携带者(纯合子比例4.50%,杂合子比例34.27%)远高于全球其他人群。rs671变异也是诱发食管癌发生的重要风险因素,所以喝酒脸红应少喝酒。
代谢性疾病,特别是Ⅱ型糖尿病和肥胖,已成为中国和世界范围内发病率最高的重大慢病。但是,欧洲人群中最显著的Ⅱ型糖尿病遗传风险TCF7L2基因变异(如rs7903146)在中国人中的频率却很低,可见在代谢特征和疾病研究中,仅参考和验证欧美人群的结果是不行的。
另外,一个人携带的某个基因变异产生的疾病风险可能并不大,但综合多个基因变异的作用后对个体特征有重大影响。因此,基于特定人群的大规模基因型和表型数据库,通过多基因风险评分(PRS)评估个体的疾病风险是一种比较准确的方法。
在ChinaMAP研究中,研究者对Ⅱ型糖尿病遗传风险进行了多基因风险评分,以量化评分、年龄和血糖值的排序三维显示了每个人在整个群体中的精确位置。多基因风险评分排名显示了Ⅱ型糖尿病高风险和低风险的个体之间存在非常显著的血糖差异,高风险个体随着年龄的增加,空腹和餐后2小时血糖都显著高于中风险和低风险者。
此外对比证实,基于东亚人群的基础数据比基于欧洲人群的数据结果更加准确。这些结果提示,基于中国人群基础数据对Ⅱ型糖尿病及其他代谢性疾病进行精确风险评估的重要性,对重大慢病的预防、个体化健康管理和公共卫生决策具有价值。
综上所述,ChinaMAP以覆盖中国各地区的研究队列为基础建立了高质量中国人群数据库,通过高深度全基因组数据和精细表型分析,可为疾病机制研究、预防、遗传咨询和公共卫生管理提供依据。
澎湃新闻记者 陈斯斯 通讯员 李东