数据库NCBI的SRA数据结构

NCBI的SRA(SequenceReadArchive)数据库是抓们用于存储二代测序的原始数据,包括,IonTorrent,Illumina,SOLiD,HelicosandCompleteGenomics.除了原始序列数据外,SRA现在也存在rawreads在参考基因的aligmentinformation.

NCBI中SRA数据结构的层次关系:Studies,Experiments,Samples,Runs:

Studies是就实验目标而言的,一个study可能包含多个experiment.

Experiments包含了样本,DNAsource,测序平台,数据处理等信息。一个experiment可能包含一个或多个runs。

Runs表示测序仪运行所产生的reads.

SRA数据库用不同的前缀加以区分:ERPorSRPforStudies,SRSforsamples,SRXforExperiments,andSRRforRuns。

下面以SRP为例说明









































北京最好白癜风医院咨询
北京到哪家治疗白癜风最好



转载请注明:http://www.92nongye.com/tlfc/204614815.html