写在前面
- 植物miRNA与动物miRNA在多种特征上存在区别,所以直接使用miRDeep或miRDeep-2去分析植物miRNA数据是非常不负责任的。
- miRDeep-P2是de novo预测,不是通过同源序列匹配
- 得到的结果需要依据已有的miRNA家族命名,获得的新的miRNA家族也需要命名,这部分分析代码并不包含在miRDeep-P2中
- 关于miRDeep-P2及miRNA的问题欢迎交流qq:734256624
软件下载地址:https://sourceforge.net/projects/mirdp2/files/,推荐下载最新版
参数
NECESSARY:
-g/–genome reference genome file in fasta format
-x/–index/prefix bowtie index file corresponding to reference genome(是bowtie的index,不是bowtie2)
-f/–fasta formatted sRNA-seq file in fasta format
-q/–fastq unformatted sRNA-seq file in fastq
-i/–input input file(s), multiple files are seperated by comma (,)
-b/–batch list file of input files
-o/–outputpath to output folder (输出文件夹路径最后不要加斜线"/",输出文件夹需要自己提前构建)
OPTIONAL:
-L/–locate THRESHOLD of different locations one read can map to, default is 15 (个人认为,如果是4倍体,这里的参数可以设置为30试一试)
-N/–length THRESHOLD of length of precursor candidates, default is 300 (根据目前的植物miRNA标准,这里不建议修改)
-M/–mismatch THRESHOLD of allowed mismatches for bowtie mapping, default is 0
-R/–rpm THRESHOLD of reads rpm when filtering, default is 10 (这里可以适当放低,RPM为5也是可以接受的)
-p/–thread number of thread used for RNAfold, default is 1
–large-index use this option when using large bowtie index, e.g. when using *.ebtwl files (如果基因组很大,bowtie构建的index后缀为 ebtwl,则需要加上 --large-index参数)
-h/–help print this help
示例:
- 构建bowtie index(不是bowtie2)
bowtie genome.fasta genome.index
- 运行miRDeep-P2
i. 如果基因组不大,则可以看到bowtie构建的index后缀为ebtw,不需要加–large-index参数;如果index后缀为ebtwl,则需要加上–large-index参数。
ii. 输出文件夹需要提前构建
iii. -o后加的输出文件夹最后不要加斜线"/"
输出文件夹中后缀为P_prediction的文件为miRNA的信息文件mkdir miRDP2_out miRDP2-v1.1.4_pipeline.bash -g genome.fasta -x genome.index -q -i sRNA-seq_trimmed.fq -o miRDP2_out -R 5