序列文件格式

多种数据分析可选的序列文件格式

按需选择下游测序数据分析的首选格式

Illumina测序的文件格式

我们提供多种用于下游分析的序列数据选项,可将数据转换为兼容的序列文件格式(例如FASTQ文件)。Illumina测序仪设计使得数据可轻松地传输到Illumina Connected Analytics和BaseSpace Sequence Hub,用于基于云的数据管理、分析和合作。

原始数据文件以序列文件格式提供,该格式兼容或易于转换为标准化数据格式,用于简化大型队列的汇集和挖掘。通过DRAGEN BioIT平台,可以获得最新的文件格式FASTQ.ORA。FASTQ.ORA是一种无损压缩文件,可减小文件大小、传输时间和存储成本。

FASTQ序列文件格式

FASTQ 文件格式

FASTQ是基于文本的测序数据文件格式,可储存原始测序数据和质量分值。FASTQ文件已成为储存Illumina测序系统的NGS数据的标准格式,可用作多种二级数据分析解决方案的输入。

MiniSeq和MiSeq测序仪提供自动将数据从BCL转换为FASTQ格式的选项,因此不需要单独的转换软件。

了解更多关于FASTQ文件

FASTQ ORA序列文件格式

FASTQ ORA是基于文本的FASTQ测序数据文件格式的二进制压缩文件格式。fastq.ora文件最多可比相应的fastq.gz文件小5倍,且不会影响数据完整性。

所有 fastq.ora 文件格式均可通过 Illumina 免费提供的 DRAGEN ORA 解压缩软件读取。安装完成后,只需一条简单命令即可将解压缩结果直接导入 BWA¹、STAR²、Bowtie³ 等常用比对工具。

了解更多关于 DRAGEN 二级分析

下载 DRAGEN ORA 解压缩软件

BCL 序列文件格式

二进制碱基检出(BCL)文件包含 Illumina 测序仪生成的原始数据。BCL 序列文件格式必须先转换为 FASTQ 格式,才能用于用户自建或第三方数据分析工具。

DRAGEN 二级分析流程套件中提供快速的 BCL至FASTQ 转换功能;Illumina 也同时提供独立的 BCL Convert 软件,可分离数据并将BCL文件转换为标准FASTQ文件格式以用于下游分析。

下载 BCL Convert 软件

其他序列文件格式

FASTQ文件是测序数据分析的典型起始格式。但是,BaseSpace Sequence Hub 还可创建其他常用于二级和三级分析程序的文件格式。

在NGS数据的次级和三级分析中,Illumina信息学平台中的软件平台和应用程序通常将原始数据从FASTQ文件转换为其他序列文件格式(例如.vcf、.bam),这是分析工作流程的一部分。

了解更多关于 BaseSpace Sequence Hub

更多资源

开发人员门户

访问用户指南、发布说明和更多技术信息。

在线培训

这些免费在线课程包含了文库制备、测序和数据分析的常见问题。

Illumina DRAGEN Bio-IT平台培训

深入了解准确且超快速的二级分析平台以及其中提供的流程。

企业级的保护

Illumina Connected Analytics平台的构建以安全和合规为核心,以满足最严格的安全性要求。

参考文献
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics. 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25