编者按:
人工智能(AI)是当前研究领域的热点。然而,最近慢慢的变多的研究者开始尝试将 AI 应用于另一个热门领域——微生物组研究。
由于微生物组数据的庞大性和复杂性,研究人员在解析微生物组数据的时候面临着巨大的挑战。而 AI 为研究人员提供了一种分析微生物组数据的新工具,借助 AI 或能帮助我们获得更多微生物组与宿主健康之间的联系。
那么最近都有哪些利用 AI 推动微生物组发展的研究呢?今天,我们共同关注 AI 是如何在微生物组领域发挥作用的。
AI+微生物组
微生物组产生的测序数据十分庞大,每一个来自人类的微生物样本可能都包含了高达 10,000 个物种的碎片数据。过去几年,人类肠道微生物组基因集不断扩充,研究人员发现了一批又一批微生物新基因。
虽然数据的增加意味更多的信息,但是要从如此庞大的数据中提取并挖掘有用的信息,无疑是一个巨大的挑战。
实际上,如果把这些海量数据说成一个“重大的计算挑战”可能太轻描淡写了。当你拥有上万个物种的 DNA 数据时,你究竟要从哪里开始呢?怎样做才能找到最重要、最关键的信息呢?是否会遗漏什么线索呢?
为了解决这个计算挑战,很多研究人员将目光投向了 AI。人工智能可以帮助我们更好地了解这些数据背后的生物学秘密。比如个性化营养初创公司 Viome 就正在利用独有的 AI 算法分析肠道微生物组数据,为用户提出更合理的饮食建议。
(关于 Viome 公司的更多信息,《肠道产业》曾报道过:肠道菌群+人工智能,这家公司杀出一条血路!)
那么,究竟都有哪些研究人员在利用 AI 分析微生物组数据呢?都做出了什么新结果呢?
微生物组预测年龄
大量证据表明,人类肠道微生物组随着年龄不断变化,甚至可能会影响成年人的衰老。但是肠道微生物组和其它部位的微生物组与年龄之间的相关程度差异,以及是否能够最终靠微生物组样本预测人的年龄尚不清楚。
近期,南昌大学徐振江和加州大学圣地亚哥分校的 Rob Kinght 团队共同阐明了这一问题1。研究人员利用机器学习的方法对皮肤、口腔和肠道三种不同来源的人类微生物组数据做多元化的分析,以预测年龄。
《热心肠日报》对该研究也做过报道:
南昌大学徐振江等:微生物组或可预测人的实际年龄
mSystems
[IF:6.519]
结合公开数据,用随机森林模型,评价粪便、唾液及皮肤(手和前额)样本微生物组预测成年人年龄的能力; 皮肤微生物组可提供最佳的年龄预测(mean±SD为3.8±0.45年,口腔和肠道微生物组年龄预测mean±SD分别为4.5± 0.14和11.5 ±0.12年); 多个队列研究均表明肠道微生物组与实际年龄有关; 手微生物组年龄预测模型可应用到前额微生物组年龄预测,反之亦然; 与老年人富集的细菌相比,年轻人富集的细菌,丰度更高,且在多个群体中普遍存在。
Human Skin, Oral, and Gut Microbiomes Predict Chronological Age
02-12, doi: 10.1128/mSystems.00630-19
具体地,研究小组从 18 到 90 岁的受试者中收集了近 9,000 个微生物组样本,并使用这些数据对随机森林回归模型进行优化、训练和测试,获得了微生物组与年龄之间的关系。
研究表明,在三种来源的微生物组中,皮肤微生物组预测年龄的准确性最高,其次是口腔,最后是肠道微生物。
研究人员认为皮肤微生物之所以最为准确可能是由于年龄的增长,皮肤生理经历了明显的变化,比如皮肤含水量减少,皮肤变得更干燥。
徐振江教授表示:“将微生物与年龄相关联的新能力可能有助于我们进一步研究微生物在衰老过程以及和年龄相关的疾病中所起的作用,并且或许可以帮助我们更好地测试针对微生物组的潜在治疗性干预措施。”
该研究由 IBM Research AI 资助,对该研究的结果,IBM 人工智能健康生活计划项目的负责人 Ho-Cheol Kim 表示:“研究结果的准确性表明了应用人工智能技术或能更好地了解人类微生物组。”
然而,微生物组的预测力量可能不至于此,1 月 22 日,Science发表文章特别关注了两篇通过微生物预测疾病和死亡的预印文章2。
肠杆菌是人类肠道中生活的多种微生物之一。图片来自:KTSDESIGN
Science:微生物组预测死亡?
这两项最新的研究发现,我们肠道中的微生物可以比基因更加准确地揭示某些疾病,并且还可以预见未来 15 年内面临死亡的风险。
关于该Science新闻,《热心肠日报》也做过报道:
Science 新闻:肠道微生物预测你在 15 年内死亡的可能性
Science
[IF:41.037]
近期两份预印报告数据显示,肠道微生物或可比人体自身基因更能准确预估人死于15年内的可能性; 肠道菌群基因组区分人体健康和疾病的能力比人体自身基因高20%,预测结肠癌的能力比人体自身基因高50%; 芬兰数千人长达15年的跟踪调查显示,粪便中肠杆菌门(如大肠杆菌和沙门氏菌)丰度高的人更有可能在15年内死去; 无论肠道菌群是以某种形式导致疾病和死亡还是只展示了身体别处发生的未知,都值得医生和科学家的关注。
The microbes in your gut could predict whether you’re likely to die in the next 15 years
01-22, doi: 10.1126/science.abb0111
【主编评语】这是Science的一位科学记者主要根据今年1月预印的两份研究报告撰写的新闻稿。第一份(https://www.biorxiv.org/content/10.1101/2019.12.31.891978v1)比对了菌群基因组和人体自身基因组预测受环境影响巨大的复杂疾病(如结肠癌、高血压和肥胖等),发现只有1型糖尿病是唯一一种人体自身基因组预测能力高于肠道菌群基因组预测能力的疾病。第二份(https://www.medrxiv.org/content/10.1101/2019.12.30.19015842v2)发现不同地区的7211名芬兰人(包括不同的基因背景、生活方式和死亡率)中粪便的菌群组成肠杆菌门可预测人15年内死亡的概率。虽然这两份报告数据显示肠道菌群具有潜在预测疾病与死亡的能力,但仍未通过同行评议,因此仅供新闻观点阅读,不具备临床指导能力。(@潇洒小姐陈)
在第一项研究中,研究者回顾了 47 项研究工作,并探究了肠道微生物的共有基因组和 13 种常见疾病之间的相互联系。这些疾病包括精神分裂症、高血压、哮喘等,它们都被认为属于“复杂性疾病”,因为上述疾病同时受环境和遗传因素影响。
研究人员把这些分析结果和 24 个通过全基因组关联分析(GWAS)将特定遗传变异与人类疾病关联起来的研究结果放在一起进行了比较分析。
该团队在公开于 bioRxiv 上的文章中表示,总体而言,在区分健康个体和生病个体时,相比使用基因组信息,利用肠道微生物的遗传特征进行分辨,最终效果可提升 20%。而在预测结肠癌方面,通过肠道微生物组进行预测,效果可提升 50%。仅仅在预测I型糖尿病方面,利用基因组分析优于微生物组。
虽然该研究的作者 Braden Tierney(一名来自哈佛医学院的计算生物学家) 承认,该项分析只是初步的探索,但他认为这项工作最终将造福大众。
Braden 说:“在临床上,我们大家可以通过微生物组学和人类遗传学的方法来改善病人的生活品质。我们的目标是努力找到并确定微生物基因组和人类基因组中有助于我们诊断这些复杂疾病的关键标志因子。”
不过也有人提出了另一种看法。VIB-KU 鲁汶微生物中心的微生物研究者Jeroen Raes 认为:“虽然我们十分清楚我们的基因如何工作,但是我们对于体内的微生物的了解还少之又少。所以,在这种情况先贸然将二者进行比较分析,是十分危险的。”
但是,他同时也认为,利用微生物做多元化的分析的一个优势是微生物会受人体所处的外部环境影响,比如吃了什么或者运动量如何。按照这个逻辑,微生物或许可以更好地预测像 II 型糖尿病一样的受大量环境因素影响的疾病。
而在另一项研究中,研究者分析了人体微生物组和寿命长短的联系。
这项分析利用了一项芬兰研究数据,这项研究从 1972 年便开始收集成千上万的健康数据。在 2002 年,参与者捐献了粪便样本,15 年后这些样本全部被测序完成。
该研究数据分析的结果显示,体内一种包括大肠杆菌和沙门氏菌在内的肠杆菌科富集的个体在后续的 15 年内死亡概率会更高。
而且该研究发现,芬兰的东部和西部人群的肠道细菌和死亡风险都存在相关性,尽管东西方拥有不同的遗传背景和生活方式。
来自福瑞德·哈金森癌症研究中心 Samuel Minot 表示,他对这项研究印象深刻,因为如此长周期的研究是罕见而且难以重复的。他说:“我希望在未来能看到更多的类似的研究。”
虽然在这两项研究中,我们依旧无法明确微生物为何会和死亡与复杂疾病发生关联。可能是微生物会通过某种方式导致疾病和缩短人的寿命,也有一定的可能这些微生物的改变只是反映机体正在发生的某些变化。
不管是哪种可能,Tierney 说:“致力于预防和治疗人类疾病的医生和科学家们都应该对这些生活在我们肠道中的微小居民们投入更多的关注。”
虽然关于微生物和复杂疾病之间的关系还有大量未知,但是在另一类疾病中,或许我们离揭示微生物和疾病之间的关系已经更进一步了。
图. 癌症的微生物信号:微生物可定植在各种组织中,这些微生物的 DNA 和 RNA 信号能在各类组织中发现,包括血液中(此处为了简化仅展示 DNA)。
Rob Knight 团队在以前研究的基础上展示出微生物 DNA 和 RNA 能在肿瘤中检测得到并可作为癌症标志物。AI 模型可通过来源于组织和血液样本的核酸信号来区分癌症类型,以及区分健康个体和罹患某种癌症的个体。
Rob Knight:微生物组或可诊断癌症
3 月 11 日,Rob Knight 团队在Nature杂志上发表了最新的研究成果,该研究分析了血液和组织中的微生物3。
关于该研究,《热心肠日报》也做过相关报道:
Nature:分析血液和组织的微生物组,或能诊断癌症
Nature
[IF:43.07]
分析33种癌症的全基因组和全转录组数据(1万患者,1.8万样本),鉴定肿瘤和正常组织以及血液中的微生物DNA和RNA; 约7.2%的序列为非人类来源,用机器学习模型鉴定出不同癌症和组织类型的微生物特征; 对于游离肿瘤DNA检测效果有限的Ia-IIc期和无基因组改变的癌症,血液微生物DNA(mbDNA)能较好的区分不同癌症类型; 分析69例健康人和100例癌症患者证实,mbDNA能用来区分健康人和癌症患者以及不同癌症类型。
Microbiome analyses of blood and tissues suggest cancer diagnostic approach
03-11, doi: 10.1038/s41586-020-2095-1
【主编评语】Rob Knight团队在Nature发表的一项最新研究,对癌症基因组图谱(TCGA)项目中的1.8万个样本测序数据进行大规模分析,鉴定出癌症相关的血液和组织微生物组特征。即使经过非常严格的去污染分析(去掉高达92.3%的测序数据),血液微生物DNA也展现出不俗的癌症诊断潜力,或能作为游离肿瘤DNA检测的补充手段,用于癌症的诊断和监测。(@mildbreeze)
该团队使用 TCGA 肿瘤数据库,一个包含 DNA 和 RNA 测序数据的在线数据库,分析了 33 种类型癌症的数据,总计使用了超过来自 10,000 名病人的 17,000 份样本。
然后研究者们使用了包括独立训练的人工智能(AI)模型在内的多种算法对这些样本中的微生物序列过滤、归一化和分类。
在通过严格的过滤方法去除了数据中的潜在污染和其它变量后,研究小组将总测序片段的 7.2%归为非人源序列。这些序列中大约有三分之一能被注释为细菌、古菌或病毒,并且其中又有 12.6%能确定为某一个特定属。
作者们接着用这些数据训练了机器学习模型,以辨别不同的癌症类型、同一癌症类型的不同阶段,以及区分肿瘤和正常组织。
总体而言,这些模型在辨别癌症类型以及区分癌症和正常组织上表现良好,但是在区分同一癌症不同阶段上表现出一定的差异。他们的研究表明,血液中的微生物 DNA(mbDNA)或可用于区分癌症类型。
这些研究结果令人兴奋,然而,这项研究存有很多限制,也就是意味着还有非常多的机会来完善这项研究。
缺陷之一就是 TCGA 样本的采集方式无法控制微生物或 mbDNA 污染,这种污染有可能在样本收集和测序之间的任一时间点被引入。
第二,用于人体研究的 DNA 和 RNA 测序或许无法完全表征微生物。基于当前已有的工作,未来的研究应该使用恰当的测序技术对精心筛选后的组织和血液样本做多元化的分析,以表征微生物。
第三,为了验证这些微生物在癌症肿瘤和血液中的存在,深入了解其分布和功能很重要。
Rob Knight 团队和其它团队依据核酸序列在肿瘤中鉴定出微生物信号。然而这些微生物定位在哪里并不知道(在肿瘤细胞内部或周围,免疫细胞或在像是间质这一结缔组织中)并且是否是活的也不清楚。
未来,需要更多的研究来确定这些微生物是来源于癌症还是仅仅是些在肿瘤微环境改变后的过客。
最后,对微生物如何进入并存在于癌组织中,以及研究如何最有效地针对它们治疗甚至是预防癌症,都要求我们进一步在机制上深入了解。
尽管有一些限制,但是这项研究为通过监测和调控微生物组推动临床进展并深化我们的见解提供了诱人的可能。
AI会如何推动微生物组发展?
无疑,AI 在生命科学领域的运用获得了许多令人惊讶的结果。从 IBM Watson 在 CT 扫描中识别肺栓塞,到 Google Deep Mind 识别视网膜病变,再到最近Cell的一项新研究报道利用机器学习方法从 1 亿多个分子中发现了强大的新型抗生素4。
AI 的飞速发展为我们大家带来了各种新可能。或许未来,AI 能够在微生物组领域帮助我们阐明更多微生物组与宿主健康之间的互作机制,为我们大家带来更多惊喜的结果。让我们大家一起期待吧!
参考文献或资料:
(滑动下方文字查看)
1.Huang, Shi, etal. "Human Skin, Oral, and Gut Microbiomes Predict ChronologicalAge." MSystems 5.1 (2020).
2.https://www.sciencemag.org/news/2020/01/microbes-your-gut-could-predict-whether-you-re-likely-die-next-15-years
3.Ajami, NadimJ., and Jennifer A. Wargo. "AI finds microbial signatures in tumours andblood across cancer types." (2020).
4.Stokes, Jonathan M., et al. "A deep learning approach to antibiotic discovery." Cell 180.4 (2020): 688-702.