从植物sRNA-seq数据中de novo预测miRNA的工具--miRDeep-P2

little^raccoon

于 2022-04-21 10:35:27 发布

阅读量843

点赞数 1

分类专栏：生物信息 miRNA 文章标签： miRNA sRNA-seq miRDeep-P2

本文链接：https://blog.csdn.net/weixin_40099163/article/details/124314799

版权

生物信息同时被 2 个专栏收录

32 篇文章 6 订阅

订阅专栏

miRNA

4 篇文章 0 订阅

订阅专栏

写在前面

植物miRNA与动物miRNA在多种特征上存在区别，所以直接使用miRDeep或miRDeep-2去分析植物miRNA数据是非常不负责任的。
miRDeep-P2是de novo预测，不是通过同源序列匹配
得到的结果需要依据已有的miRNA家族命名，获得的新的miRNA家族也需要命名，这部分分析代码并不包含在miRDeep-P2中
关于miRDeep-P2及miRNA的问题欢迎交流qq:734256624

软件下载地址：https://sourceforge.net/projects/mirdp2/files/，推荐下载最新版

参数
NECESSARY:
-g/–genome reference genome file in fasta format
-x/–index /prefix bowtie index file corresponding to reference genome（是bowtie的index，不是bowtie2）
-f/–fasta formatted sRNA-seq file in fasta format
-q/–fastq unformatted sRNA-seq file in fastq
-i/–input input file(s), multiple files are seperated by comma (,)
-b/–batch list file of input files
-o/–output path to output folder （输出文件夹路径最后不要加斜线"/"，输出文件夹需要自己提前构建）

OPTIONAL:
-L/–locate THRESHOLD of different locations one read can map to, default is 15 （个人认为，如果是4倍体，这里的参数可以设置为30试一试）
-N/–length THRESHOLD of length of precursor candidates, default is 300 （根据目前的植物miRNA标准，这里不建议修改）
-M/–mismatch THRESHOLD of allowed mismatches for bowtie mapping, default is 0
-R/–rpm THRESHOLD of reads rpm when filtering, default is 10 （这里可以适当放低，RPM为5也是可以接受的）
-p/–thread number of thread used for RNAfold, default is 1
–large-index use this option when using large bowtie index, e.g. when using *.ebtwl files （如果基因组很大，bowtie构建的index后缀为 ebtwl，则需要加上 --large-index参数）
-h/–help print this help

示例：

构建bowtie index（不是bowtie2）
```
bowtie genome.fasta genome.index
```
运行miRDeep-P2
i. 如果基因组不大，则可以看到bowtie构建的index后缀为ebtw，不需要加–large-index参数；如果index后缀为ebtwl，则需要加上–large-index参数。
ii. 输出文件夹需要提前构建
iii. -o后加的输出文件夹最后不要加斜线"/"
```
mkdir miRDP2_out
miRDP2-v1.1.4_pipeline.bash -g genome.fasta -x genome.index -q -i sRNA-seq_trimmed.fq -o miRDP2_out -R 5
```
输出文件夹中后缀为P_prediction的文件为miRNA的信息文件