分子数据获得
自测数据:1PCR产物的直接测序或克隆测序 2 新一代高通量转录组或基因组测序
序列拼接
叠连群(contig):拼接获得的较长DNA片段。
软件:SOAP
来源公共数据库的分子数据
过程:1 确定查找的分类单元
2 在NCBI主页上选择nucleotideshujuku
3在返回结果页面的右侧有Organisms【tree】链接 可以点击{tree}
查看一个分类单元被提交到GenBank中序数量的办法
NCBI主页 Taxonomy数据库 查找分类单元名称
查看一个分类单元被记录到中序数量的
NCBI主页 Taxonomy数据库 查找分类单元名称 点击所查找的分类单元
数据库序列获取方法
1 关键词搜索
insect[organsim]
1000[Slen]:2000Slen
最常用的检索方法:基因名称[gene name] +分类单元拉丁文[organism]
例如:g6pd[gene name] +metazoa[organism]
2 BLAST 搜索
登录BLAST网站 选择FASTA文件
批量下载序列的方法
方法1:NCBI主页上输入下载序列AC号的范围 (中间用冒号)并指明搜索域[ACCN] EF100000:EF102000[ACCN]
**方法2:**BioEdit法
比对序列数据库
1 NCBI的COG和HomeoloGene
2 pafm
3 treeBASE
序列比对
序列比对(sequence aligenment) 通过确定各位点序列之间匹配、替换及插入或缺失发生位置来建立同源分子之间位点同源关系的过程。
分类: 全序列对比 局部序列对比
序列对比软件:CLustalX T-Coffee DIALGN MUSCLE MAFFTPOA和ABA