16S rRNA 测序分析流程

科学界从很早就开始认识到微生物对人类健康和生态环境的作用。传统的微生物技术主要针对菌株的分离鉴、培养以及计数等。限于这些微生物学研究的手段,研究人员难以高效地获得样本内,全部的微生物的种类和丰度信息。随着测序技术手段的广泛应用,目前已经有较为成熟的方式获得样本中已知微生物的丰度信息。这就是16S rRNA测序技术。


1. 什么是16SrRNA测序技术?

16S核糖体RNA(16S ribosomal RNA),简称16S rRNA,是原核生物的核糖体中30S亚基的组成部分。16S rRNA的长度约为1,542 bp。由于该序列在进化上可以很好的区分不同属水平的不同微生物,因此可以作为菌株的区分标志。目前学术界已经有比较成熟公共数据库,对不同菌属的16S rRNA序列进行汇总整理。相关信息见下表

数据库 链接 说明
SILVA https://www.arb-silva.de/ 包含细菌、古生菌和真核生物领域的分类信息。它主要基于小亚基 rRNA(原核生物为 16S,真核生物为 18S)的系统发育。
GreenGene https://greengenes.secondgenome.com/ 专门用于细菌和古生菌。系统发育树由从公共数据库获得并通过质量过滤的 16S rRNA 序列构建。序列通过其字符和二级结构对齐,然后使用 FastTree 进行树构造
RDP http://rdp.cme.msu.edu/ 目前已经相对很少文章引用

2. 16S rRNA分析步骤

16S rRNA测序可以分为以下基本步骤

  • 测序数据质量控制
  • 通过Qiime2套件获得菌属定量信息
  • 菌属差异分析
  • Picrust2通路分析

2.1 数据质量控制

从实验设计角度来讲,一般二代测序即使用双端也难以测通完整的16S rRNA区域,因此二代测序目前的策略都是测一部分可变区域。这导致一般而言无法把所测得的序列定位到种的水平,由于这种序列长度限制,因此一般都会将测到的序列对应的实体称为OTU( operational taxonomic units)。

由于16S rRNA序列是和菌属的对应关系,因此在开始下游分析之前,需要对测序质量较差的序列进行过滤以保证菌属鉴定的有效性。

2.2 Qiime2 套件分析

Qiime2是目前16S rRNA测序方面较为公认的数据处理工具盒,其中整合了数据基本处理、OTU聚类、多样性统计(α多样性、β多样性)差异分析等基础功能。

这里值得需要注意的是,在差异分析部分,从文献报道来看,尚无非常有效的方式。尤其是不同方式直接差异还是比较大的。因此一般都会将差异部分单独来进行处理,相对常见的如采用LEfSe,进行。


2.3 菌属差异分析

LEfSe分析即LDA Effect Size分析,可以实现多个分组之间的比较,还进行分组比较的内部进行亚组比较分析,从而找到组间在丰度上有显著差异的物种。

2.4 PICRUST 通路分析

菌属之间的分类差异,意味着其所携带的基因和对应生物学功能以及代谢通路上的差异,PICRUST是为了分析这些差异而产生的分析工具,其原理利用了菌属之间的进化关系,对基因实体丰度进行了估计,进而将对应的生物学通路进行了定量,以表征不同样本之间的在代谢和功能上的差异。


3 小结

除了二代测序之外,三代测序也有针对微生物的扩增子测序方案。但是其应用上目前还是受限于三代测序价格和数据库等因素,普及程度不如二代测序广泛。

但是二代测序在定量和差异稳定性方面依然存在一定的问题,今后有机会可以跟大家分享在16S rRNA差异菌属鉴定方面的一些内容,欢迎大家持续关注。

Powered by XTAO TechnologyLast Modified On:2021 2023-03-24 09:05:16

results matching ""

    No results matching ""