blastp 短肽比对求助

问一下大家,我想用blastp找到一个11氨基酸小肽的同源序列,我手里有一些物种(人、鸡、鼠…)的蛋白序列。我把这些物种的蛋白序列合并为了一个fasta文件。
我想筛选出bit-score>20的肽段,于是通过 E = q u e r y _ s e q u e n c e _ l e n g t h ∗ t o t a l _ d a t a b a s e _ l e n g t h / 2 b i t − s c o r e E=query\_sequence\_length*total\_database\_length/2^{bit-score} E=query_sequence_lengthtotal_database_length/2bitscore算出了bit-score为20时对应的e_value。
我先对merge.fa进行了搜索,使用了下面的命令:

blastp -db merge.fa -query test.fa -out test.merge.0 -task blastp-short -outfmt 0 -evalue 5283 -word_size 2 -matrix PAM30

又对chicken.fa进行了搜索,使用了下面的命令:

blastp -db chicken.fa -query test.fa -out test.chicken.0 -task blastp-short -outfmt 0 -evalue 44 -word_size 2 -matrix PAM30

但出现了两个问题。

  1. 首先,bit-score的阈值并不是期望的"20",而是"18"。

    chicken 比对结果,箭头示bit-score阈值为18.0
    chicken 比对结果,箭头示bit-score阈值为18.0

    merge 比对结果,箭头示bit-score阈值为18.0
    merge 比对结果,箭头示bit-score阈值为18.0

  2. 其次,我将对chicken的搜索结果与merge的搜索结果进行了比对,发现chicken的搜索结果很多都消失了。

merge中包含chicken的结果
chicken-1
chicken-2
chicken-3
chicken-4

chicken的搜索结果,方框示merge中出现的4个序列,箭头示未出现的多条序列
chicken的搜索结果,方框示merge中出现的4个序列,箭头示未出现的多条序列

那些中间的蛋白序列哪去了??

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值