代谢组常用数据库
代谢组学是以质谱(MS)技术为基础的新型高通量组学技术。由于检测的是小分子,因此非常贴近实际应用检测。技术大致可分为靶向代谢组和非靶向代谢组。
其数据处理过程与基因组学研究区别较大。本文意在梳理在代谢组学研究中常用的数据库网站和应用网站。以便广大科研工作者对应查看。
1.化合物信息数据库
代谢组学的核心,就是对检测对象(人或其他物种)的代谢产物中的中小分子进行定量或定性的检测。因此,需要尽可能地得到可能的检测物范围。因此经常需要用到已知代谢产物数据库,这类数据库主要记录的是化合物相关信息,部分数据库包含化合物质谱信息。
2. 通路数据库与分析工具
代谢产物在生物内会通过代谢通路形成复杂的代谢的网络,从而实现生物学功能。由于分子生物学和生物化学的大量知识的积累,已经形成了经典通路,并开发了一系列针对经典通路的统计学分析工具,目前常见的通路数据库和分析工具整理如下:
数据库名称 | 链接 | 说明 |
---|---|---|
SMPDB | https://smpdb.ca/ | 对化合物对应的通路进行汇总,但其网站功能只支持单化合物查询,不支持进一步统计分析 |
KEGG | https://www.genome.jp/kegg/ | 经典数据库,可单个化合物查询,不支持进一步统计分析 |
Grinn | https://kwanjeeraw.github.io/grinn/fetchgrinn.html | R扩展包,实现查询功能,除了支持代谢物分子查询外,也支持基因蛋白查询 |
MetaboAnalyst | https://www.metaboanalyst.ca/MetaboAnalyst/ | 网页在线版分析集成工具,用户可一站式对代谢物对应通路进行相关查询 |
3. 质谱数据处理分析软件
对于高通量质谱产生的数据,基本分析思路是,通过格式转化工具,将不同平台的数据转化为统一格式,再经由质谱数据分析软件对信号进行检测,常用的工具如下:
工具名称 | 链接 | 说明 |
---|---|---|
MZmine2 | https://mzmine.github.io/download.html | 鉴定工具(开源) |
ProteoWizard | https://proteowizard.sourceforge.io/ | 质谱数据格式转化工具 |
4. 深入分析
深入分析主要指根据课题或研究目标的需要对数据进行进一步分析,对于代谢组学而言,其目标常常与鉴定已于检测的biomarker或微生物组学分析相关,常见的工具列举如下:
工具名称 | 链接 | 说明 |
---|---|---|
MiMeNet | https://github.com/YDaiLab/MiMeNet | 通过深度学习解决代谢组结果与微生物之间关联 |
OptimalCutpoints | https://cran.r-project.org/web/packages/OptimalCutpoints/index.html | biomark截断点估计 |