家医健康
国内健康世界健康探索科学

扩展非洲人类肠道微生物组图谱

新闻时间:2025年1月29日 - 更新时间:2025-02-06 00:29:48
来源:Nature
语言:英语,所在国:南非
分类:科学研究 , 关键词:硒与微生态

人口研究表明,微生物群落微生物组与地理位置、生活方式、遗传和环境因素之间存在相互作用。然而,大约84%的世界人口生活在低收入和中等收入国家(LMIC),这些国家在大规模微生物群落微生物组研究中代表性不足。本文介绍了AWI-Gen 2 微生物组项目,这是一项横断面微生物群落微生物组研究,共采集了来自布基纳法索、加纳、肯尼亚和南非的1,801名女性的样本。通过与从农村和园艺到后工业和城市非正式定居点的各种社区合作,我们捕捉到了更广泛的人口多样性。利用宏基因组测序技术,我们确定了具有地理和生活方式关联的分类群,包括城市人群中 TreponemaCryptobacteroides 种类的减少和 Bifidobacterium 种类的增加。我们发现了1,005个细菌宏基因组组装基因组,并确定抗生素敏感性可能是驱动 Treponema succinifaciens 在城市人群中缺失的因素。最后,我们发现了一种由几种以前未与HIV相关联的分类群定义的HIV感染特征,包括 Dysosmobacter welbionisEnterocloster 属。总之,这是迄今为止针对非洲个体微生物群落宏基因组的最大规模人群代表性调查,结合广泛的临床生物标志物和人口统计数据,为微生物组相关发现提供了广阔的机会。

AWI-Gen 2 微生物组项目是在布基纳法索的纳诺罗、加纳的纳弗龙戈、南非阿金科特-布什巴克里奇次区、南非迪克加莱、南非约翰内斯堡的索韦托镇以及肯尼亚内罗毕的库罗戈乔和维万达尼城市非正式定居点进行的。参与者代表了这些卫生和人口监测系统(HDSS)覆盖区域内的成年人横截面样本。这些研究社区涵盖了农村、半城市和城市地区,因此在人口密度、水卫生条件、医疗保健获取和疾病谱方面存在巨大差异。简而言之,纳诺罗和纳弗龙戈研究中心位于西非主要从事园艺的农村地区,以自给农业和养牛为主要生计方式。阿金科特和迪克加莱中心主要由正在经历快速流行病学转变和工业化的半农村村庄组成。索韦托是约翰内斯堡市的一个区,在种族隔离时期被指定为黑人居住区;作为后工业化地区,索韦托的就业通常与商业、零售和工业有关,但女性失业率仍超过60%。内罗毕中心涵盖了两个城市非正式定居点,那里人口密度非常高,居民获得自来水和卫生设施的机会有限。

AWI-Gen 2 是一项针对32至98岁成年人的横断面研究(99%的参与者年龄在41至84岁之间)。怀孕妇女和居住少于10年的居民被排除在外。每位参与者在招募时仅包括一人。大多数参与者为女性(n=1,801),尽管也采集了少量男性样本(n=19)。研究的重点是将这些数据与伴随的更年期研究相结合。男性的样本显示出显著较低的α多样性(P=0.027),但在下面呈现的所有站点比较中均被排除;然而,鉴于现有微生物组研究中这些人群的代表性不足,男性样本被纳入了以下呈现的基因组目录。参与者填写了一份问卷,并捐赠了血液、尿液和单份粪便样本。粪便样本收集在温度稳定的缓冲液中,并在同一地点一次性处理,以尽量减少处理偏差(方法)。每个粪便样本提取DNA,进行了2×150碱基对的双端测序。我们每样本生成了中位数为44.16百万(范围27.48M至104.79M)的读取量,质量控制和去除人类读取量后剩余的中位数为31.20百万(范围17.80M至72.95M)(方法,扩展数据图3和补充数据2)。关于每个研究中心及其招募方法的详细描述见补充方法。

首先,我们表征了研究人群的整体分类组成。我们使用mOTUs3进行分类鉴定,并用GTDB分类法总结特征(方法和扩展数据图3)。在按整体微生物组组成聚类样本后,主要变异轴反映了拟杆菌门和芽孢杆菌门A之间的相对丰度权衡(图1b和扩展数据图4),并与甲烷杆菌门的丰度相关。第二主坐标(PCo2)捕捉了站点差异(图1b),总体上按站点人口密度、生计策略、环境和社会人口因素的梯度排序样本。例外的是内罗毕,肯尼亚,这是一个高密度的城市站点,却落在梯度中间。这种第二轴与Spirochaetota和Elusimicrobiota的丰度相关,这些门被描述为随着工业化程度的提高而相对丰度降低。相对于来自西欧和日本的外部队列,AWI-Gen 2队列中个体的Verrucomicrobiota和Spirochaetota的相对丰度较高,而放线菌门的相对丰度较低(扩展数据图4)。

为了识别对组成变异影响最大的地理、疾病和生活方式因素,我们使用可用的协变量进行了基于距离的冗余分析,排除了高度相关的变量(扩展数据图5和方法)。站点解释了最多的组成变异(7.92%),其次是与其他微生物组密切相关的变量,例如最近使用抗生素(0.79%)、最近腹泻(0.59%)、使用驱虫药(0.51%)或益生菌使用(0.46%)。有趣的是,HIV状态是唯一解释较大变异比例的疾病相关变量(0.52%)。其他疾病变量包括关节炎、肥胖和高血压等(扩展数据图5)。

为了深入探讨各站点之间的差异,我们研究了微生物多样性和丰度。原核生物多样性在各站点间存在显著差异(Kruskal-Wallis P≤2.2×10^-16)(图1c),反映了之前观察到的第二主坐标站点梯度,内罗毕再次偏离序列。许多分类群在研究站点之间表现出独特的相对丰度和普遍性模式(补充数据3)。少数分类群在具有相似人口密度和生计策略的站点之间差异不明显(阿金科特和迪克加莱,3种;纳诺罗和纳弗龙戈,37种),而在具有不同特征的站点之间则存在显著差异(索韦托和纳诺罗,345种)(图1d和补充数据4)。在各站点间差异最明显的细菌属中(方法),一些相对丰度与之前观察到的站点梯度呈正相关,例如 PhocaeicolaBacteroidesBifidobacterium ,而另一些则与反向梯度相关,例如 PrevotellaCryptobacteroidesOribacterium 和 _TreponemaD (图1e)。这些丰度梯度通常在每个属内的细菌物种中共享(图1f),并在整体物种普遍性(扩展数据图6a)中反映出来,其中一些分类群普遍存在,而其他分类群的普遍性则随站点梯度增加或减少。

内罗毕和索韦托之间的比较特别有趣,这两个都是工业化或后工业化城市站点。尽管内罗毕人口密度很高,但内罗毕的个体往往与阿金科特和迪克加莱的个体相比,其微生物组组成更为相似,而不是与索韦托的个体相似(图1d-f和扩展数据图6a,b)。 PhocaeicolaBacteroidesPrevotella 和 _TreponemaD 物种的相对丰度在内罗毕和半农村站点之间有些相似。相比之下, Bifidobacterium 物种在索韦托和内罗毕人群中都具有较高的相对丰度。这些发现表明,“城市化”或“工业化”这些通常引用的变量无法充分捕捉不同城市地区和不同农村地区之间的生活方式和环境差异。

总之,站点是解释整体微生物组组成的主导因素。疾病和药物变量解释了较小比例的微生物组组成,HIV状态是继站点之后对微生物组变异贡献最大的因素之一。这些发现表明,研究站点代表了不同的生计策略、工业化水平、医疗保健获取和整体不利条件,这些因素共同影响微生物组组成。这些发现还提出了一个微生物组转变动态模型。像 _TreponemaD 这样的分类群在从事大规模农业或工业的站点中较少见,而 BacteroidesPhocaeicola 物种逐渐增加, Prevotella 物种逐渐减少。尽管在其他队列中有报道,但我们并未观察到 PrevotellaBacteroides 之间的相互排斥(扩展数据图6c)。我们观察到内罗毕参与者的有趣分类群特征,他们中的许多人可能从肯尼亚农村迁移到内罗毕的非正式定居点:高 Prevotella 丰度可能反映了参与者以前农村住所保留下来的微生物特征,而高 Bifidobacterium 物种丰度和低 Cryptobacteroides 物种丰度可能反映了受环境变化强烈影响的分类群。

非洲微生物群落微生物在公共参考集合中代表性不足,即使存在,也往往来源于生活方式不具代表性的相对孤立人群。为了识别AWI-Gen 2样本集合中以前未知的分类群,我们进行了宏基因组组装并将重叠群分箱为宏基因组组装基因组(MAGs),总共获得了69,539个基因组,其中34,215个基因组为高质量(大于90%完整且小于5%污染),26,660个为中等质量(大于等于50%完整,小于10%污染)。为了压缩冗余基因组,我们将所有MAGs以50%最低基因组完整性和5%最大基因组污染在95%平均核苷酸同一性(ANI)下去重复。最终的2,613个MAGs跨越了19个细菌门(图2a和补充数据5)。我们构建了一个由所有中等和高质量MAGs在95%氨基酸同一性下聚类而成的蛋白质目录,包含63.8M个独特蛋白质。

我们比较了我们的原核生物基因组和蛋白质目录与统一人类胃微生物群落基因组(UHGG)目录中的4,744个原核生物物种代表和统一人类胃微生物群落蛋白质95(UHGP95)目录中的20.5M个蛋白质。AWI-Gen 2数据集中包括1,005个相对于UHGG的新原核生物MAGs(图2b,c),以及相对于UHGP95的7.6M个新蛋白质(扩展数据图7a)。大多数新的细菌MAGs属于门Bacillota A、放线菌门和芽孢杆菌门。我们还观察到来自古菌门Methanobacteriota、Thermoplasmatota和Halobacteriota的29个独特的MAGs(图2d),其中九个在UHGG中未找到,表明AWI-Gen 2人群含有大量的新古菌。大多数个体样本产生了几个以前未知的原核生物基因组和成千上万个相对于参考集合的新蛋白质(扩展数据图7b,c),其中纳诺罗的个体贡献了最多的新基因组。

与全球其他人群的大规模微生物群落微生物组宏基因组数据集相比,43,545个MAGs中有598个是AWI-Gen 2研究独有的,这一数量远远超过了非洲大陆以外其他研究的贡献(扩展数据图7d)。此外,对来自六个研究站点的样本生成的原核生物基因组(扩展数据图7e)和蛋白质(扩展数据图7f)的稀疏分析表明,任何特征都没有达到饱和。至关重要的是,这些结果表明,在这些社区中进一步测量微生物群落微生物组将继续显示出新的微生物组多样性。

非洲微生物群落微生物在公共参考集合中代表性不足,即使存在,也往往来源于生活方式不具代表性的相对孤立人群。为了识别AWI-Gen 2样本集合中以前未知的分类群,我们进行了宏基因组组装并将重叠群分箱为宏基因组组装基因组(MAGs),总共获得了69,539个基因组,其中34,215个基因组为高质量(大于90%完整且小于5%污染),26,660个为中等质量(大于等于50%完整,小于10%污染)。为了压缩冗余基因组,我们将所有MAGs以50%最低基因组完整性和5%最大基因组污染在95%平均核苷酸同一性(ANI)下去重复。最终的2,613个MAGs跨越了19个细菌门(图2a和补充数据5)。我们构建了一个由所有中等和高质量MAGs在95%氨基酸同一性下聚类而成的蛋白质目录,包含63.8M个独特蛋白质。

我们比较了我们的原核生物基因组和蛋白质目录与统一人类胃微生物群落基因组(UHGG)目录中的4,744个原核生物物种代表和统一人类胃微生物群落蛋白质95(UHGP95)目录中的20.5M个蛋白质。AWI-Gen 2数据集中包括1,005个相对于UHGG的新原核生物MAGs(图2b,c),以及相对于UHGP95的7.6M个新蛋白质(扩展数据图7a)。大多数新的细菌MAGs属于门Bacillota A、放线菌门和Bacillota。我们还观察到来自古菌门Methanobacteriota、Thermoplasmatota和Halobacteriota的29个独特的MAGs(图2d),其中九个在UHGG中未找到,表明AWI-Gen 2人群含有大量的新古菌。大多数个体样本产生了几个以前未知的原核生物基因组和成千上万个相对于参考集合的新蛋白质(扩展数据图7b,c),其中纳诺罗的个体贡献了最多的新基因组。

与全球其他人群的大规模微生物群落微生物组宏基因组数据集相比,43,545个MAGs中有598个是AWI-Gen 2研究独有的,这一数量远远超过了非洲大陆以外其他研究的贡献(扩展数据图7d)。此外,对来自六个研究站点的样本生成的原核生物基因组(扩展数据图7e)和蛋白质(扩展数据图7f)的稀疏分析表明,任何特征都没有达到饱和。至关重要的是,这些结果表明,在这些社区中进一步测量微生物群落微生物组将继续显示出新的微生物组多样性。

我们比较了我们的原核生物基因组和蛋白质目录与统一人类胃微生物群落基因组(UHGG)目录中的4,744个原核生物物种代表和统一人类胃微生物群落蛋白质95(UHGP95)目录中的20.5M个蛋白质。AWI-Gen 2数据集中包括1,005个相对于UHGG的新原核生物MAGs(图2b,c),以及相对于UHGP95的7.6M个新蛋白质(扩展数据图7a)。大多数新的细菌MAGs属于门Bacillota A、放线菌门和Bacillota。我们还观察到来自古菌门Methanobacteriota、Thermoplasmatota和Halobacteriota的29个独特的MAGs(图2d),其中九个在UHGG中未找到,表明AWI-Gen 2人群含有大量的新古菌。大多数个体样本产生了几个以前未知的原核生物基因组和成千上万个相对于参考集合的新蛋白质(扩展数据图7b,c),其中纳诺罗的个体贡献了最多的新基因组。

与全球其他人群的大规模微生物群落微生物组宏基因组数据集相比,43,545个MAGs中有598个是AWI-Gen 2研究独有的,这一数量远远超过了非洲大陆以外其他研究的贡献(扩展数据图7d)。此外,对来自六个研究站点的样本生成的原核生物基因组(扩展数据图7e)和蛋白质(扩展数据图7f)的稀疏分析表明,任何特征都没有达到饱和。至关重要的是,这些结果表明,在这些社区中进一步测量微生物群落微生物组将继续显示出新的微生物组多样性。

我们比较了我们的原核生物基因组和蛋白质目录与统一人类胃微生物群落基因组(UHGG)目录中的4,744个原核生物物种代表和统一人类胃微生物群落蛋白质95(UHGP95)目录中的20.5M个蛋白质。AWI-Gen 2数据集中包括1,005个相对于UHGG的新原核生物MAGs(图2b,c),以及相对于UHGP95的7.6M个新蛋白质(扩展数据图7a)。大多数新的细菌MAGs属于门Bacillota A、放线菌门和Bacillota。我们还观察到来自古菌门Methanobacteriota、Thermoplasmatota和Halobacteriota的29个独特的MAGs(图2d),其中九个在UHGG中未找到,表明AWI-Gen 2人群含有大量的新古菌。大多数个体样本产生了几个以前未知的原核生物基因组和成千上万个相对于参考集合的新蛋白质(扩展数据图7b,c),其中纳诺罗的个体贡献了最多的新基因组。

与全球其他人群的大规模微生物群落微生物组宏基因组数据集相比,43,545个MAGs中有598个是AWI-Gen 2研究独有的,这一数量远远超过了非洲大陆以外其他研究的贡献(扩展数据图7d)。此外,对来自六个研究站点的样本生成的原核生物基因组(扩展数据图7e)和蛋白质(扩展数据图7f)的稀疏分析表明,任何特征都没有达到饱和。至关重要的是,这些结果表明,在这些社区中进一步测量微生物群落微生物组将继续显示出新的微生物组多样性。

我们比较了我们的原核生物基因组和蛋白质目录与统一人类胃微生物群落基因组(UHGG)目录中的4,744个原核生物物种代表和统一人类胃微生物群落蛋白质95(UHGP95)目录中的20.5M个蛋白质。AWI-Gen 2数据集中包括1,005个相对于UHGG的新原核生物MAGs(图2b,c),以及相对于UHGP95的7.6M个新蛋白质(扩展数据图7a)。大多数新的细菌MAGs属于门Bacillota A、放线菌门和Bacillota。我们还观察到来自古菌门Methanobacteriota、Thermoplasmatota和Halobacteriota的29个独特的MAGs(图2d),其中九个在UHGG中未找到,表明AWI-Gen 2人群含有大量的新古菌。大多数个体样本产生了几个以前未知的原核生物基因组和成千上万个相对于参考集合的新蛋白质(扩展数据图7b,c),其中纳诺罗的个体贡献了最多的新基因组。

与全球其他人群的大规模微生物群落微生物组宏基因组数据集相比,43,545个MAGs中有598个是AWI-Gen 2研究独有的,这一数量远远超过了非洲大陆以外其他研究的贡献(扩展数据图7d)。此外,对来自六个研究站点的样本生成的原核生物基因组(扩展数据图7e)和蛋白质(扩展数据图7f)的稀疏分析表明,任何特征都没有达到饱和。至关重要的是,这些结果表明,在这些社区中进一步测量微生物群落微生物组将继续显示出新的微生物组多样性。

【全文结束】


(全文结束)