Efficient cloud data analysis for COPD multiomics project
简介
日本冈山大学的Shuta Tomida博士带领了一个生物信息学团队,专注于精准癌症研究。他的团队耗费5个月的时间完成了一个多组学项目,该项目的研究方向为肺癌的已知风险因素——慢性阻塞性肺疾病(COPD)。他们分别使用了50个样本进行血液生殖系全基因组测序(WGS)、肺组织肿瘤全外显子组测序(WES)、肺组织全转录组RNA测序(RNA-Seq)以及肺组织鸟枪法宏基因组学分析。为了按时完成项目,Tomida博士与因美纳合作优化了他的新一代测序(NGS)生物信息学研究流程。
“能够通过Illumina Connected Analytics在云端环境中运行DRAGEN流程是一个巨大优势。”
安全、高效的二级分析
Tomida博士说:“最具挑战性的任务之一是按时完成全基因组测序数据的分析。”该项目要求冈山大学的研究人员使用日本的数据分析解决方案。团队决定使用基于云端的Illumina Connected Analytics,通过Amazon Web Services(AWS)东京服务器访问。
Tomida博士说:“先决条件是,我们正在寻找一个可以使用高规格计算资源的环境,这些资源很难在现场构建和维护。我们选择了Illumina Connected Analytics,它拥有各种即用型分析流程,例如用于WGS分析的DRAGENTM Germline,用于WES分析的DRAGEN Enrichment,以及用于RNA-Seq分析的DRAGEN RNA。此外,使用基于云端的数据分析工作流程非常简单易用。即使是不具备专业医学知识的生物信息学家也可以使用Connected Analytics来分析NGS数据。”
合作定制流程
“就与因美纳团队的整体合作而言,包括入门支持和培训计划,我们感到非常满意,”Tomida博士说,“因美纳支持团队与我们携手合作,能够快速反馈并解决任何问题,帮助我们按时完成最初的计划。”
为了完成宏基因组分析,Tomida博士及其团队使用了与因美纳团队合作构建的定制DRAGEN Metagenomics流程。该流程部署在Connected Analytics Japan实例上,以便Tomida博士能够执行这部分分析。
"在我们的Connected Analytics环境中,50-60 Gb输入的WES数据分析时间约为50分钟,130-160 Gb输入的WGS数据分析时间约为2.5小时。”
云端分析的可扩展性
“总体而言,我们能够在最初规定的期限内完成数据上传、分析和下载。这些分析的成本也在预算内。”Tomida博士说,
“从我们使用Connected Analytics的经验来看,云端环境非常不错。在我们的Connected Analytics环境中,50-60 Gb输入的WES数据分析时间约为50分钟,130-160 Gb输入的WGS数据分析时间约为2.5小时。现场构建和维护这样的计算环境十分困难,而能够通过Connected Analytics在云端环境中运行DRAGEN流程是一个很大的优势。”
Tomida博士已成功获得资金支持,用于增加后续多组学项目研究的样本量,他计划继续使用Connected Analytics。他预测,借助Illumina Connected Analytics和DRAGEN分析,“NGS数据分析将不再限制研究速度。”