三代数测序据分析
三代测序技术简介
三代测序技术(Third Generation Sequencing)是目前较为流行的科研手段。其长读长和高通量的优势,很好的补充了二代测序数据和Sanger测序数据的不足。
三代测序数据分析中的问题
- 但是三代测序技术在数据分析时存在一系列问题:
- 如软件安装相对繁琐
- 目前三代分析软件常用的调度系统为SGE或Slurm,其对任务占用资源的监视和控制能力,存在明显短板。因此在有其他分析过程中,三代分析作业的存在会对其他类型作业的稳定运行产生一定的影响。
- 三代测序对计算资源的使用常为突发性的。如果不允许三代测序分析作业,资源利用常常存在空闲,不能充分利用计算资源。
Achelous 平台对三代数据分析的支持
Achelous在开发时考虑了,三代测序分析的种种问题。开发了兼容SGE调度的接口,三代测序数据分析用户,可以通过Achelous进行作业提交,并且由于Achelous的资源管理能力,可以实现资源在最大程度上的合理使用。
例如,三代数据的基因组组装(Genome Assembly)常用的工具Falcon可以在Achelous上顺利执行,同时,在空闲时间,用户也可以在同一集群执行WDL作业。