基本类型及测序技术
一、类型
1、核苷酸序列数据
DNA:ATCG
RNA:AUCG
2、蛋白序列
20种氨基酸排列的顺序
3、其他
(1)分子标记数据
(2)生物芯片数据
(3)生物表型数据
二、测序技术
1、一代测序
主要是sanger法
2、二代测序
illumina
MGI
还有其他用的不多的方法
3、三代测序
pacbio
nanopore
常用数据库
一、基因序列数据库
GeneBank
EMBL
DDBJ
RefSeq
GDB
二、蛋白数据库
Uniprot
TrEMBL
swiss-prot
iProClass
PIR
PDB
SCOP
CATH
InterPro
三、疾病相关数据库
OMIM
HGMD
ClinVar
HGVA
HGVS
ExAC
HGBASE
常用数据类型
一、fasta
第一部分以">"开头,包括id、序列描述等内容
第二部分为序列
二、fastq
第一部分以"@"开头,包括id、序列描述等内容
第二部分为序列
第三部分为"+"开头,描述信息
第四部分为质量值
三、gff/gft
基因注释文件,包括染色体、基因、位点、转录本、CDS等描述信息
四、sam/bam
比对后生成的文件,主要描述比对的信息
五、bed
主要来描述注释信息
六、wig
主要是描述覆盖深度和测序深度