NCBI的SRA(SequenceReadArchive)数据库是抓们用于存储二代测序的原始数据,包括,IonTorrent,Illumina,SOLiD,HelicosandCompleteGenomics.除了原始序列数据外,SRA现在也存在rawreads在参考基因的aligmentinformation.
NCBI中SRA数据结构的层次关系:Studies,Experiments,Samples,Runs:
Studies是就实验目标而言的,一个study可能包含多个experiment.
Experiments包含了样本,DNAsource,测序平台,数据处理等信息。一个experiment可能包含一个或多个runs。
Runs表示测序仪运行所产生的reads.
SRA数据库用不同的前缀加以区分:ERPorSRPforStudies,SRSforsamples,SRXforExperiments,andSRRforRuns。
下面以SRP为例说明