叶绿体基因组简单重复序列(SSRs)分析

叶绿体基因组简单重复序列(SSRs)分析

简单重复序列: single sequence repeats (SSRs)

简单重复序列又被称为微卫星序列 是指基因组中的一段串联重复序列,如:AAAAAAAAAAAATATATATATATATATAT

叶绿体分析中一般使用MISA进行分析其简单重复序列。

MISA 参数设置如下:
单核苷酸:重复10次及以上, 如AAAAAAAAAAA (A)11
二核苷酸:重复6次及以上, 如ATATATATATATATAT (AT)7

有两种输出方式 MISA 或者 GFF
默认输出成MISA
在这里插入图片描述
有两种输出方式 MISA 或者 GFF
默认输出成MISA即可

结果解读:

下载并打开.misa文件,即可看到各种类型的SSRs, 如下图所示,文件中有三种p1,p2 分别代表单核苷酸和双核苷酸类型,而c代表的是compound SSR 如上图的所示
在这里插入图片描述
统计的时候这些c类型的SSRs 会被统计成一条,因此我们需要对其进行拆分。

也可以将两个SSRs之间的距离设置的小一些,这样可以大大减少C类型的SSRs

拆分后其总和应该和.statistics文件中的Total number 相等。
在这里插入图片描述
最后我们得到50条SSRs 和他们在基因组上的位置,然后就可以根据注释好的叶绿体基因组文件编写相应的脚本,得到这些SSRs在叶绿体基因组上的具体区域,如某基因中或某两个基因的间区或者是内含子区域。

MISA网站经常进不去,所以自己写了个SSRs的分析脚本、大概200多行 C类型的SSRs也可以直接整理成标准格式。
脚本实现

写在末尾

如果分析中有不明白的地方,可以私信我哦,我看到了一般都会回复的
  • 5
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值