分类: 医学研究, 微生物组测序

百迈客一直秉承“生物科技长信,服务社会,造福人民”的企业使命,致力于让生物科技更快,更好的提高人类生活质量。通过整合高通量测序技术、生物信息技术与云计算、大数据等新兴IT技术,为用户开启生物科技服务2.0新时代。各种测序的经验也都是十分丰富,今天给大家带来一篇结直肠癌对肠道微生物群菌群落结构的影响研究报道,了解应用的新方向。详解见下文:

摘要

背景: 结直肠癌是全球癌症相关死亡的主要原因。想要了解结直肠癌的发生、发展和治疗,人类肠道微生物菌群是一个热门的研究领域。多项研究发现结直肠癌患者的肠道微生物群中特定细菌丰度与健康人群相比有显著性变化,但是还没有明确哪没有一种细菌与所有病例相关。目前还不清楚这种变化与癌变的因果关系,但重点应放在解释与癌症相关的肠道微生物群落结构变化上。

结果:通过对先前发表的252份来自健康和晚期结直肠癌患者的全基因组测序粪便样本进行新的分析,我们确定了癌症相关人类肠道微生物菌群的分类、功能和结构变化。根据这些数据分析揭示了健康的肠道微生物菌群和结直肠癌相关肠道微生物菌群之间潜在的微生物群落结构变化的显著差异。发现在分类学上和功能上与癌症相关的细菌与其他细菌形成关联,并且在功能上形成适应于与肿瘤相关的生态系统中的潜在变化的模块。通过对这些样本进行的微生物群落分析得到,与癌症相关细菌的物种多样性显著增加,被归类为源自口腔微生物菌群的物种相对丰度增加,包括Fusobacterium nucleatum, Peptostreptococcus stomatis, Gemella morbillorum还有Parvimonas micra等。分析群落功能的差异丰度后得出,与毒力因子和肽降解相关的功能表达增加,与结肠直肠癌肠道微生物菌群内氨基酸生物合成相关的功能表达减少。

结论:我们通过对大量晚期结直肠癌患者和健康受试者得到的全基因组测序粪便样本,分析出结直肠癌相关肠道微生物菌群中发生的许多潜在的重要分类、功能和结构改变。分析表明,癌症影响肠道微生物菌群中细菌的组成,一些特殊的口腔菌群及其相关菌群可能与肿瘤的发生有关。

实验方法

材料:178位健康人(男女比例56.18/43.82)和74位晚期(52位三期/ 22位四期,男女比例58.11/41.89)结直肠癌患者的粪便样本

方法:宏基因组测序,统计分析

研究方法

细菌群落分类学分析

使用基于em的方法计算每个样本内物种的相对丰度,以构建一个样本分类单元矩阵,通过测量每个样本的细菌丰富度和Shannon指数,利用该矩阵探究两个样本组(健康和晚期CRC)的微生物多样性。CRC组的样本显示出更大的多样性,包括丰富度和Shannon指数(Mann-Whitney U检验:MWU);丰富度:MWU pvalue = 0.0005, Shannon指数:MWU pvalue = 0.0009)(图一a,b)。由于物种多样性的量度对物种均匀度和丰富度的敏感性不同,还应用了辛普森指数来计算样本组内的物种多样性,这些结果与之前的分析一致,CRC样本中的物种多样性与健康样本中的物种多样性有显著性差异(MWU值= 0.0238).
评估健康和晚期结直肠癌相关肠道微生物群之间的细菌群落分类特征差异。对样本分类群矩阵进行CLR转换,使用主成分分析进行基于分类剖面的样本排序。前两个主成分只能解释总方差的一小部分(PC1: 7.98%,PC2: 5.61%),基于主成分分析的线性变换未显示健康样本与CRC样本有差异,但通过随机森林分类器(RFC)可以区分两个样本组(AUC = 0.87)(图 2a)。虽然RFC根据重要性对物种进行排序,但这些默认度量是有一定偏差。为获得RFC提供的物种重要度的统计显著性,在我特征集中包含一个“随机”特征。通过使用100个RFC的集合,发现了17种细菌,在这些显著“重要”物种上训练的100个RFC的准确性分类得分大于在所有物种上训练的100个RFC的准确性分类得分(所有物种平均准确性为74%;17个非常“重要”的物种平均准确率为80%(图 2c)。物种差异丰度分析显示,与健康肠道微生物组相比,CRC相关肠道微生物组中有174个物种的相对丰度显著降低,10个物种的相对丰度显著升高。这174个细菌物种分别来自84个属,大多数来自 Enterobacter(6.8%), Klebsiella(6.3%), Streptococcus(5.2%), Lactobacillus (5.1%), Citrobacter(4.6%), Bifidobacterium(4%),Bacteroides(3.4%),以及 Clostridium(3.4%)。CRC中相对丰度显著升高的10个物种是 Parvimonas micra(qvalue = 3.09e-09), Peptostreptococcus stomatis(qvalue = 4.51e-08), Gemella morbillorum(qvalue = 4.55e-08), Fusobacterium nucleatum(qvalue = 1.08e-06), Streptococcus anginosus(qvalue = 1.13e-03), Dialister pneumosintes (qvalue=1.37e-03),Peptostreptococcus anaerobius (qvalue=4.74e-03), Streptococcus sp. KCOM 2412(Streptococcus periodonticum)(qvalue = 7.18e-03), Ruminococcus torques(qvalue = 1.55e-02),以及ilifactor alocis(qvalue = 2.85e-02)。

有趣的是,许多在CRC中被认为非常“重要”且相对丰度较高的物种也存在于口腔微生物组中,也与部分口腔疾病(牙周炎、根尖周病变、根管感染、口腔癌等)、CRC风险的增加有关。随后,我们通过人类口腔微生物数据库(eHOMD)对我们样本中的所有口腔物种进行分类,发现与健康组相比,CRC相关肠道微生物组内存在的总口腔微生物种群丰富度显著增加(MWU: pvalue = 6.51e-05)(图2 d)。


图1

图2
细菌群落功能分析

为分析健康的肠道微生物群落功能和结直肠癌肠道微生物群落功能的差异,还有蛋白质家族特点(TIGRFAMs)和蛋白质结构域(Pfams)。主成分分析解释了样本组间聚类中等方差分别是PC1: 27.19%、PC2: 4.33%。差异丰度分析显示12个Pfams(与健康组相比,CRC升高7个,降低5个)和两个TIGRFAMs(与健康组相比,CRC升高1个,降低1个)的相对丰度具有统计学显著性差异(MWU-FDR: qvalue%3C 0.05)。在结直肠癌肠道微生物组中显著升高的Pfams与细菌侵袭素和粘附素(例如FadA)有关,而显著降低的Pfams与抗生素抗性、噬菌体成熟和苏氨酸生物合成有关。CRC中显著升高的单一TIGRFAM与脯氨酸亚氨基肽酶相关,而显著降低的TIGRFAM再次与苏氨酸生物合成相关。

细菌关联网络

首先,计算所有样本中每种物种的流行率(图3a),发现细菌种类流行计数在组内的分布呈现双峰分布,一个峰值阈值为90%。我们将群体内样本流行率超过90%的物种称为高度流行物种(HPS),发现每一组HPS中的大多数物种是共享的(健康组:97%,CRC: 95%)(图3b)。健康组中五个独特的HPS是:Hespellia stercorisuis,Clostridium saccharolyticum,Monoglobus pectinilyticus, Streptococcus sp. oral taxon 431,和Odoribacter laneus。CRC关联组独有的八个HPS:Intestinibacillus massiliensis, Prevotella copri, Haemophilus parainfluenzae, Ruminococcus bicirculans, Streptococcus mitis, Neglecta timonensis, Bifidobacterium catenulatum,和Anaerotignum neopropionicum。Streptococcus mitis和 Haemophilus parainfluenzae都被eHOMD归类为口腔微生物。发现HPS的相对丰度占样品总相对丰度82%(图3c)。除了这些高度普遍和丰富的物种之外,还纳入一些被RFC认为非常“重要”的物种,并发现它们的丰度存在差异。增加了8个物种(arvimonas micra, Peptostreptococcus stomatis, Gemella morbillorum, Fusobacterium nucleatum, Streptococcus anginosus, Dialister pneumosintes, Peptostreptococcus anaerobius, and Ruminococcus torques)到物种群(共165种)的网络构建中。将多个网络属性与随机网络中显示的属性进行比较来检查网络的非随机性,与随机网络相比,健康组和CRC都表现出统计学显著(Monte Carlo Simulation; MCS);较短的平均最短路径长度(ASPL)(Healthy and CRC: MCS pvalue< 0.001),较高的传递性(Healthy and CRC: MCS pvalue< 0.001)和更高的模块化(Healthy and CRC: MCS pvalue< 0.001)。这些结果表明,构建的网络显示出显著非随机的特性,并且网络内的物种通过短路径彼此连接,与它们的邻近物种具有积极的关联,并且形成模块(即物种的组或集群),其特征在于在同一模块内的物种之间发生的关联占大多数,而与模块外的物种存在的关联很少。

图3

群体网络包含相似的关联权重分布,正相关比负相关更多(图4a)。值得注意的是,与健康网络相比,CRC包含更多的负相关。29%的负相关涉及一种被认为是口腔微生物的物种,而在健康网络中,没有发现涉及口腔菌群。在网络中发现的大多数关联是该网络独有的(健康:69%,CRC:72%)(图4b)。我们假设群落结构的这种巨大差异可以反映生态系统的变化,并进而分析了网络中物种之间的分类关系(图4c)。两个网络在同一属内的物种(健康:MCS pvalue= 0.00099,CRC:MCS pvalue= 0.00099)和家族(健康:MCS值= 0.00099,CRC:MCS= 0.00099 )。然而,只有在健康组的网络中,物种与来自同一顺序的其他物种的积极相关仍然明显多于随机相关(健康:MCS pvalue= 0.00099,CRC: MCS pvalue = 0.44)。与健康网络(健康:4%,CRC:17%)相比,CRC的网络在分类上的远缘关系中显示出更大的丰度,在健康网络中分类上的远缘微生物之间的正关联仍然显著较少(门内:MCS值= 0.00099,门外:MCSp值= 0.00099)和CRC(门内:MCS pvalue= 0.00099,门外:MCS pvalue= 0.00099)而不是随机网络。


图4

通过构建CLR转换的模块功能来比较模块的潜在功能。模块功能(蛋白域)图谱的PCA显示出较大的差异(PC1: 33.73%,PC2: 14.53%),模块似乎形成包含两组代表的簇团(图 5a)。为了定义模块的聚类,进行了轮廓分析,估计五个聚类作为用于K-均值聚类的最*K值(图 5b)。通过K-均值聚类定义模块聚类后(图 5c)对这些集群进行了分类分析。在整个网络中,同一集群内的模块被发现在分类学上是相似的,不包括簇1和簇5,簇1和簇5显示出物种占有的变化,其中在健康网络的簇1内发现的一些物种被显示在CRC组的簇5内。然而,两个网络对在簇2、3和4中发现的物种有很强的一致性。第2组中的物种仅有“致病菌”(即通常无害但在特定环境条件下具有致病能力的物种)口腔微生物,而簇3主要是链球菌种和簇4主要类杆菌种。随后,进行聚类功能分析以发现蛋白质结构域,以及蛋白质家族的主要作用和次要作用,这使得聚类在功能上不同。簇1的功能与细胞表面粘附、对抗冲突策略、酪氨酸重组酶、多糖降解、糖胺聚糖结合、肿瘤蛋白酶抑制、过氧化物酶功能、碳水化合物/纤维素结合活性和氨基酸生物合成相关。簇2的功能涉及对宿主细胞和细胞外基质的粘附、细胞感染、胶原结合、补体抗性、鸟氨酸/赖氨酸/精氨酸脱羧酶(组织腐败/多胺合成/酸性环境抗性)、金属肽酶、V型分泌系统、氨的产生和有毒金属离子的排泄(铜流出系统)、细胞包膜、DNA代谢、脂肪酸和磷脂代谢、表面多糖和脂多糖的生物合成和降解。簇3的功能与粘蛋白结合、锌清除/吸收、细胞表面粘附、葡萄糖结合/转运和铜结合、蛋白质和肽的命运/合成/分泌、多糖/碳水化合物、有机醇和酸的降解方面有关。簇4的功能涉及金属结合、二瓜氨酸环化酶/磷酸二酯酶、群体感应、碳水化合物结合和半胱氨酸/木瓜蛋白酶、核苷和核苷酸、转运和结合蛋白、TCA循环、铁携带以及表面多糖的降解和生物合成。最后簇5的区别功能与氨肽酶、三羧酸受体、乙醇胺转运、淀粉利用、木葡聚糖/多糖结合、能量代谢、氨基酸和胺、阳离子和铁化合物、电子转运以及表面多糖和脂多糖的生物合成和降解相关。检查了在每个集群内发现的用于网络构建的物种的丰度(健康:簇1 (33%)、簇2 (2%)、簇3 (5%)、簇4 (26%)、簇5 (7%)、无(27%);CRC:簇1 (19%)、簇2 (3%)、簇3 (3%)、簇4 (12%)、簇5 (30%)、无(33%)(图6)。我们的发现表明,与健康组相比,在CRC中,第2类和第5类组模块中发现的物种总数增加,第1类、第3类和第4类组中发现的物种减少。这些结果也反映在我们发现的总样本相对丰度的统计显著变化中,即群内物种在群间所占的比例(第一组: MWU值= 4.29 e-12;第二组:MWU值= 3.16 e-16;第三组:MWU值= 0.0002;第四组:MWU值= 2.62-13;第五组:MWUp值= 2.81 e-29;无集群物种:MWU值= 4.40-17(图7)。此外,发现网络内的大多数负面关联(健康:100%,CRC:96%)发生在占据不同集群类型内模块的物种之间。只有在CRC中,簇1的物种之间才出现集群内的负相关,其中物种种类和丰度也显示出减少。

图5
图6
 
图7
最近文章