机器学习分析HELIUS研究中性别和绝经期差异对肠道微生物组的影响
Machine learning analysis of sex and menopausal differences in the gut microbiome in the HELIUS study
性别差异在肠道微生物组中已有多项研究,但结果不一致,通常由于样本量较小。我们在这项大型多民族人群队列研究中调查了性别和绝经期差异对肠道微生物组的影响,包括5166名参与者。利用机器学习模型,我们发现性别和绝经期状态与肠道微生物组组成之间存在微弱关联(AUC 0.61-0.63)。调整年龄、心血管风险因素和饮食后,最高排名的肠道微生物与性别之间的部分关联减弱,但大多数关联仍具有显著性。相比之下,绝经期状态的大部分关联受年龄驱动,在调整后失去了显著性。通过对宏基因组数据进行路径分析,我们发现了性别在维生素B6合成和豆蔻糖降解路径上的差异。由于一些性别差异无法用协变量解释,我们建议未来微生物组研究中进行性别分层。
研究背景
尽管对肠道微生物组对健康和疾病影响的兴趣日益增加,但在微生物组组成方面的性别差异研究仍然不足。关于性别和绝经期差异的大部分知识来自动物研究。这些研究表明,微生物酶参与性激素代谢,而性激素反过来也影响肠道微生物组组成。人类研究支持微生物类固醇降解酶与循环性激素水平之间的关联,然而,关于肠道微生物组组成性别差异的报告不一致。这些不一致可能由不同方法学或相对较小的人群样本量以及未能充分调整人口统计学、饮食和生活方式差异引起。
尽管在肠道微生物组分析中经常将性别作为协变量,但由于缺乏性别分层,其精确影响往往不清楚。相比之下,按性别或绝经期状态分层的饮食干预研究显示了对肠道微生物组的不同影响。为了减少变异性,许多临床试验排除了绝经前女性,这可能限制了对更广泛人群的推广性。因此,为了设计和解释微生物组研究,需要更好地理解性别和绝经期差异对肠道微生物组组成和功能的影响。
在这项研究中,我们使用XGBoost机器学习模型研究了性别和绝经期对肠道微生物组组成和功能的影响,以确定性别和绝经期的整体影响并识别相关微生物和路径。我们假设与性别和绝经期相关的肠道微生物组组成差异将是微弱的,主要由协变量差异驱动,而我们认为微生物路径差异将更加明显,受混杂因素影响较小。
结果
研究人群
从多民族人群基础的HELIUS队列中,我们纳入了5166名有可用粪便样本且在样本收集前三个月内未使用抗生素的参与者。人群的中位年龄为51.0岁 [四分位数范围 (IQR) 42.0, 58.0],女性平均比男性年轻2岁。男女的种族背景不同:更多的女性是非洲苏里南人,而男性更多是荷兰人和摩洛哥人。女性的平均体重指数(BMI)略高,而男性的吸烟、高血压和糖尿病患病率较高。饮食模式显示明显的性别差异,男性比女性摄入更高的能量和宏量营养素(碳水化合物、蛋白质、脂肪、纤维)。绝经前和绝经后组之间的中位年龄差为13年,绝经后女性使用抗高血压、降脂和降糖药物的比例高于绝经前女性。绝经后女性自绝经开始的中位时间为9.0年 [IQR 4.0, 15.0]。根据绝经状态的能量摄入和宏量营养素差异远小于男女之间的差异。对于纤维、脂肪酸和饱和脂肪,绝经前和绝经后组之间没有显著差异。
性别和绝经期差异在肠道微生物组组成和多样性
HELIUS参与者的粪便样本使用16S rRNA测序。我们首先评估了性别和绝经期在α多样性和β多样性上的差异。我们未发现性别在物种丰富度和Faith的系统发育多样性上的差异(P > 0.05)。然而,男性的α多样性Shannon指数显著高于女性,但绝对差异很小。同样,使用Bray-Curtis距离计算的β多样性在男性和女性之间有显著差异(PERMANOVA: P = 0.001),但R²仅为0.6%。在绝经后女性中,Shannon指数和物种丰富度略高于绝经前女性。此外,绝经前和绝经后女性之间的β多样性也有显著差异(PERMANOVA: P = 0.001),但R²仅为0.2%。
使用机器学习模型从肠道微生物组预测性别
为了评估男性和女性之间肠道微生物组组成的差异,我们使用了XGBoost算法的嵌套交叉验证设计来预测性别。该模型的曲线下面积(AUC)为0.63 ± 0.01,表明存在微弱关联。该模型中最高排名的肠道微生物预测因子包括 _Prevotella9 copri 、 Blautia faecis 、 Enterorhabdus spp.、 Odoribacter splanchinicus 、 Alistipes putredinis 和 Ruminicoccus torques group spp.,女性的相对丰度较高,但 _Prevotella9 copri 和 Enterorhabdus spp. 在男性中更为丰富。由于将绝经前和绝经后女性合并为一组可能会影响AUC,我们还进行了敏感性分析,比较了男性与绝经前女性以及男性与绝经后女性。然而,这两个模型的AUC均为0.60 ± 0.01,说明绝经期状态并未掩盖第一个模型中的性别差异。
对于与前20个最高排名预测因子的关联,我们进行了线性回归分析以获得效应大小并调整相关协变量。调整年龄、BMI、高血压、糖尿病和吸烟后,性别关联基本不变。进一步调整饮食后,导致6个预测因子失去显著性。额外调整用药(抗高血压药、降糖药、降脂药、质子泵抑制剂和全身性皮质类固醇)以及蛋白质和饱和脂肪摄入量后,结果相似,排除使用激素避孕药的参与者后结果也相似(数据未显示)。未发现性别与种族之间的交互作用。
使用机器学习模型从肠道微生物组预测绝经期状态
我们还使用相同设计的机器学习模型研究了肠道微生物组组成与绝经期状态的关联,结果AUC为0.61 ± 0.02。在未调整的线性回归模型中,绝经前和绝经后组之间的ASV丰度差异相对较小。前20个预测绝经期状态的预测因子包括 Romboutsia ilealis/timonensis 、 Clostridium sensu stricto 1 spp.、 Lachnospiraceae spp.、 Bifidobacterium spp. 和 Intestinimonas spp.,绝经前女性的相对丰度较高,但 Lachnospiraceae spp. 和 Intestinimonas spp. 除外。然而,调整相关协变量后,许多初始显著关联消失,年龄和饮食的影响最大。在非洲苏里南人和荷兰人亚组之间观察到一个显著的绝经期状态与种族之间的交互作用: Enterorhabdus spp. 在非洲苏里南女性中的关联较弱,而在荷兰女性中较强(交互项:P < 0.001)。
性别和绝经期差异的功能路径
对于259名参与者的子集,我们有宏基因组数据,允许我们进一步研究性别和绝经期对功能性肠道微生物路径的影响。与所有参与16S rRNA分析的参与者相比,这些具有宏基因组数据的参与者年龄稍大,糖尿病、高血压和吸烟的患病率更高。使用组成宏基因组谱的模型在性别和绝经期状态的关联上得出了与16S rRNA分析相似的结果,但由于组规模较小,置信区间较宽。性别在组成分析中的最佳预测物种包括 Akkermansia municiphila 、 Roseburia inulinivorans 和 Prevotella copri clade A ,与16S分析大致一致。 Akkermansia municiphila 在男性中的丰度较低,而 Roseburia inulinivorans 和 Prevotella copri clade A 在男性中的相对丰度较高。与16S分析一致,调整协变量后,前20个预测因子与性别的关联减弱。
使用微生物路径预测性别的模型得出的AUC为0.60 ± 0.06,与使用微生物物种的模型相当。最佳预测特征包括涉及吡哆醛5'-磷酸生物合成I、鸟苷四磷酸和五磷酸(ppGpp)代谢以及豆蔻糖降解路径的路径。前20个预测因子中有6个是涉及碳水化合物降解的路径。在未调整的线性回归模型中,前20个预测因子中有11个与性别显著相关。进一步调整年龄、BMI、高血压、糖尿病和吸烟后,所有这些关联仍然存在。调整饮食因素后,性别差异变化不大,但由于该模型的效力较低(N = 105),剩余关联失去了显著性。女性的ppGpp和豆蔻糖降解路径较低,而吡哆醛合成(维生素B6)在女性中高于男性。在评估分层路径数据(按物种)时,吡哆醛合成的性别差异主要由 Bacteroides ovatus 、 Bacteroides thetaiotaomicron 和 Bacteroides uniformis 驱动。豆蔻糖降解路径主要由 Ruminococcus torques 、 Roseburia inulinivorans 和 Roseburia intestinalis 中的性别差异解释。ppGpp代谢的性别差异无法归因于已知分类的物种;未分类物种驱动了这一差异。
对于绝经期状态,无论是组成还是路径的机器学习模型都无法转化为线性回归模型。当将显示性别差异的路径按绝经期状态分层时,我们发现吡哆醛合成路径在绝经后女性中比绝经前女性更丰富。然而,50岁以上男性中该路径的丰度也高于50岁以下男性,这可能反映了年龄而非激素状态的影响。ppGpp代谢和豆蔻糖降解路径在绝经前和绝经后女性之间以及50岁以上和50岁以下男性之间均未显示差异。
讨论
我们在男性和女性以及绝经前和绝经后女性之间发现了肠道微生物组组成的微弱差异。我们的回归模型显示,部分性别差异可以用饮食解释,而绝经前和绝经后女性之间的差异主要归因于年龄。尽管微生物路径显示出较少受协变量影响的性别差异,但性别与微生物路径的总体关联与微生物组成的关联程度相当,表明影响微弱。重要的是,我们发现了维生素B6合成和豆蔻糖降解路径的性别差异,强调了即使在特定机制上关注时,肠道微生物组组成的微弱性别差异也可能具有生物学意义。
在动物和人类研究中都记录了肠道微生物组组成的性别差异,但通常样本量较小、方法不同且对协变量的关注程度不一。使用机器学习方法,我们得到了一个模型指标,表明性别对肠道微生物组组成的影响相对较微弱。与我们的结果一致,包括1135名参与者的LifeLines-DEEP研究报告称,女性的微生物α多样性较高,女性的 Akkermansia municiphila 丰度高于男性。男性中 Prevotella spp. 的丰度较高,而女性中 Ruminococcus spp. 的丰度增加,这也与其他研究一致。在样本量较小的研究中,未发现显著的性别差异,或只能归因于包括体成分差异在内的协变量。这些发现强调了识别微弱关联所需的相对较大的样本量。
在我们的研究中,许多与绝经期状态的关联可以通过年龄和生活方式因素解释,表明环境因素显著影响绝经期差异在肠道微生物组中的表现。此外,我们的机器学习模型中肠道微生物组组成与绝经期状态的总体关联非常微弱,与绝经期状态解释β多样性的低方差一致。一项使用2300名受试者宏基因组测序数据的研究发现,绝经后女性在α和β多样性方面更接近男性,而不是绝经前女性。与他们的发现相反,可能是由于不同的分析方法,我们显示区分男性与绝经前和绝经后女性的AUC相同,强调了性别的影响。
我们的分析确认饮食模式是男性和女性之间肠道微生物组组成差异的重要贡献者。已知膳食因素,特别是纤维、动物蛋白和盐的摄入,会塑造肠道微生物组的组成和功能。通过我们的分析,我们发现调整膳食宏量营养素后,观察到的大部分关联减弱,这与明显的性别差异在膳食摄入中的差异一致。对于与绝经期状态的关联,年龄的影响最大。年龄与微生物组组成的关系已得到充分证实,如先前研究中沿生命周期的微生物组变异所示。
我们使用宏基因组数据的路径分析以获得对性别和绝经期差异的更深入机制理解,发现吡哆醛5'-磷酸(维生素B6)生物合成I路径在女性中更丰富。这一路径的性别差异与一项包括89名女性的小型研究中报道的绝经期差异一致。人类肝脏和细菌都需要维生素B6进行雌激素降解,导致女性循环维生素B6水平高于男性。此外,维生素B6对微生物组表现出性别特异性影响,例如维生素B6补充剂增加了女性小鼠中 Akkermansia muciniphila 的丰度,但对雄性小鼠没有这种效果。同样,在我们的数据中,吡哆醛5'-磷酸生物合成I路径与 Akkermansia muciniphila 丰度相关,确实仅在女性中如此,说明维生素B6效应可能也适用于人类。我们还发现了碳水化合物降解路径,包括豆蔻糖降解的性别差异。在小鼠中,豆蔻糖已被证明可以刺激短链脂肪酸的产生和 Akkermansia 和 Bifidobacterium 的生长。其降解过程依赖于糖苷水解酶家族的酶α-半乳糖苷酶。然而,关于性激素与α-半乳糖苷酶之间潜在相互作用的证据仍然有限。
我们未能在队列中确认关于类固醇代谢路径的性别和绝经期差异的发现。这些路径和3-β-羟基类固醇脱氢酶酶的相对流行率和丰度较低,先前研究显示差异较小或仅具轻微显著性。因此,我们使用功能分析的方法可能不足以检测这些特定差异。相反,含有β-葡萄糖醛酸酶酶的路径也在性激素代谢中起作用,相对丰富,但未出现在性别或绝经期的最佳预测路径中。
本研究的优势包括在大型、多民族、基于人群的队列中使用16S测序数据,以及在较小的子组中使用宏基因组测序数据进行路径分析,从而更深入地探索功能路径。我们的机器学习模型使我们能够评估性别和绝经期对肠道微生物组的总体影响,而交叉验证设计、随机变量的添加和置换设置防止了过拟合。我们发现的稳健性得到了16S和宏基因组分析结果一致性的支持。由于HELIUS队列中这些参与者的详细表型,我们可以评估一系列协变量对性别和绝经期差异的影响,包括药物使用和饮食摄入。
本研究的局限性包括缺乏血清激素水平数据,因为同一性别个体内的激素差异可能影响结果。绝经期状态的分类仅依赖问卷回答,而直接测量激素水平将提供更准确的分类。机器学习模型得出的AUC值较低(0.60-0.63),这意味着性别和绝经期的整体影响有限,下游结果应谨慎解读。在回归模型中,即使调整了最成熟的协变量,仍可能存在残余混杂因素,可能解释(部分)观察到的性别差异。虽然我们测试了调整膳食宏量营养素后观察到的关联是否减弱,但我们未包括具体食物类型的详细膳食数据。此外,膳食数据是在HELIUS人群的一部分中收集的,导致调整饮食后的模型样本量较小。
鉴于我们队列中男性和女性之间肠道微生物组的微弱但一致的差异,我们建议未来微生物组研究中进行性别分层,以便评估肠道微生物组干预措施的差异影响。绝经期状态与肠道微生物组组成和功能路径之间的弱关联表明绝经期状态的影响有限,进一步支持在临床微生物组研究中纳入绝经前女性。纵向分析可以进一步了解绝经期间肠道微生物组的变化,通过测量性激素(雌激素、睾酮)水平。为了更好地理解肠道微生物组组成性别差异背后的机制,体外研究可以探讨性激素是否可以直接调节细菌代谢和生长,或间接通过塑造宿主环境(包括pH值、黏液组成、免疫反应)。
我们的分析显示,性别差异在肠道微生物组组成和功能路径上比绝经期差异更明显。尽管性别对肠道微生物组的影响微弱,但部分性别差异无法用协变量差异解释。这些发现的机制尚不完全清楚,强调了在未来的微生物组研究中包括性别分层的重要性。
(全文结束)
声明:本文仅代表作者观点,不代表本站立场,如有侵权请联系我们删除。
本页内容撰写过程部分涉及AI生成(包括且不限于题材,素材,提纲的搜集与整理),请注意甄别。