- 博客(11)
- 收藏
- 关注
原创 使用maker进行基因组注释
所遇到的100个问题。(我使用过的maker主要是老师和师姐装的,如果自己装,最少还要遇到一百个问题)1.maker要在/dev/shm下运行,有点类似计算机的运行内存;2.如果提示某个perl脚本环境有问题,依照提示修改脚本环境变量相应行即可;3.运行new_species.pl遇到报错:设置图中的AUGUSTUS_CONFIG_PATH即可;4.注释出的雌株雄株基因数目相差过大,合并第二轮augustus和snap的模型后进行最后一步maker注释;5.使用maker2zff 遇到报错:
2021-12-09 10:37:04 2464
原创 bamtools拆分bam文件
bamtools拆分bam文件sRNA使用shortstack比对到基因组上的比对文件是合并的bam文件,需要按照样品将其拆分,使用bamtools进行拆分:bamtools split -in merged_alignments.bam -tag RG运行时间较久,有更好的方式再来更新。...
2021-12-07 14:19:19 1268 1
原创 linux下处理fastq格式文件
1.统计每条序列长度:awk '{if(NR%4==2){print}}' s1_1.fq |awk '{print length($1)}'
2021-09-15 09:45:59 509
原创 计算反转录转座子插入时间三:MEGA批量化处理
得到了成对的LTRs后,可根据两条LTR序列的不同,根据K-2模型计算K——每个核苷酸位点的平均替代数,使用MEGA进行计算。由于文件众多,需要多次处理,使用MEGA-cc进行处理。安装方法参考https://blog.csdn.net/g_r_c/article/details/22602071安装完成后,打开MEGA,点击右下角PROTOTYPE,进入模拟模式,选择序列类型(我使用Nucleotide non-coding)ALIGN——MUSCLE,使用默认参数点击确定生成比对配置文件*.mao。
2021-09-14 18:46:25 1690 6
原创 计算反转录转座子插入时间二:提取成对LTRs序列
上一篇讲了反转录转座子插入时间的计算原理,这篇主要是计算过程。 首先使用ltr_finder和ltr_harvest对基因组中的反转录转座子进行预测,之后用LTR_retriever整合预测结果,流程主要参考徐洲更先生的博文,输出结果如下:图源:https://www.jianshu.com/p/f962d5c40fdf其中*.fa.pass.list.gff3内包含有所有完整的反转录转座子,内容如下:每个block表示一个反转录转座子,第一行为整个LTR-RT的区域,4、5行分别...
2021-09-13 21:42:20 3667 1
原创 计算反转录转座子插入时间一:计算原理
转座子(Transposable elements, TEs)又称为转座原件,是一类特殊的DNA序列,可以通过转录或逆转录,在内切酶的作用下从染色体一个位置跳跃到另一个位置。根据转座方式不同,转座子可以分为三类[1]:I型转座子又称为反转录转座子(retrotransposon),在转座时,先以DNA为模板转录成一段mRNA,再以其为模板反转录成cDNA,在整合酶的作用下整合到基因组的新位置上。II型转座子又称转座子(transposon),在转座酶的作用下,从原来的位置解离下来,再重新整合到染色体上
2021-09-12 18:07:11 3270 1
原创 linux 进程后台挂断,查看与终止
linux 后台挂断1.nohup command &top -u user_name2.command ctrl+z暂停任务bg 将其放入后台(fg 将后台转入前台)disown -h 设置其忽略hup信号3.进程终止:a.前台进程终止ctrl+cb.后台进程终止jobs 查看job号, kill %numps查看job进程号(PID),kill pid...
2021-01-19 16:21:29 193
原创 bowtie2的安装与环境配置
bowtie2的安装与环境配置wget --no-check-certificate https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.4.2/bowtie2-2.4.2-linux-x86_64.zip/downloadexport PATH=/home/yfeng/biosoft/Bowtie2/bowtie2-2.4.2-linux-x86_64/:$PATHbowtie2
2021-01-19 16:06:21 1873
原创 报错:ls command not found
报错:ls command not foundexport PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin(仅记录
2021-01-19 16:01:52 105
原创 linux 文件及文件夹操作
linux 文件及文件夹操作修改文件夹名称:mv name1 name2(name2不存在)移动文件:mv file1 directory删除文件夹:rm -rf directory解压文件:gzip -d *.gzunzip *.zipbzip -d *.bz2压缩文件gzip file打包文件:tar cvf filename.tar file解包文件:tar -xvf filename.tar...
2021-01-19 15:58:18 51
原创 exon ,UTR, ORF与 CDS
exon ,UTR, ORF与 CDSUTRs: untranslated region intronsCDS: Sequence coding for amino acids in protein.A contiguous sequence which begins with, and includes, a start codon and ends with, and includes, a stop codon.Exon: A region of the transcript sequence
2021-01-19 15:29:38 2202
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人