第五章 数据集准备与序列对比

分子数据获得

自测数据:1PCR产物的直接测序或克隆测序 2 新一代高通量转录组或基因组测序

序列拼接

叠连群(contig):拼接获得的较长DNA片段。
软件:SOAP

来源公共数据库的分子数据

过程:1 确定查找的分类单元
2 在NCBI主页上选择nucleotideshujuku
3在返回结果页面的右侧有Organisms【tree】链接 可以点击{tree}

查看一个分类单元被提交到GenBank中序数量的办法

NCBI主页 Taxonomy数据库 查找分类单元名称

查看一个分类单元被记录到中序数量的

NCBI主页 Taxonomy数据库 查找分类单元名称 点击所查找的分类单元

数据库序列获取方法

1 关键词搜索
insect[organsim]
1000[Slen]:2000Slen
最常用的检索方法:基因名称[gene name] +分类单元拉丁文[organism]
例如:g6pd[gene name] +metazoa[organism]
2 BLAST 搜索
登录BLAST网站 选择FASTA文件

批量下载序列的方法

方法1:NCBI主页上输入下载序列AC号的范围 (中间用冒号)并指明搜索域[ACCN] EF100000:EF102000[ACCN]
**方法2:**BioEdit法

比对序列数据库

1 NCBI的COG和HomeoloGene
2 pafm
3 treeBASE

序列比对

序列比对(sequence aligenment) 通过确定各位点序列之间匹配、替换及插入或缺失发生位置来建立同源分子之间位点同源关系的过程。
分类: 全序列对比 局部序列对比
序列对比软件:CLustalX T-Coffee DIALGN MUSCLE MAFFTPOA和ABA

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值