- 博客(10)
- 收藏
- 关注
转载 bam(sam)格式文件转化为fasta格式
bam2fasta的转变方式:samtools view input.bam | awk '{OFS="\t"; print ">"$1"\n"$10}' - > output.fastasam2fasta的转变方式cat *.sam | awk '{print ">"$1"\n"$10}' > *.fasta查看bam文件 samtool
2018-07-31 09:47:00 17734
原创 linux下把软件添加到环境中遇到的问题总结
1.把路径添加到.bashrc中,(1)遇到如下问题:syntax error near unexpected token `(' 的错误原因是:linux5.0之后,是不能带有括号的,这个时候就需要转译了。方法:rm -f HIBIKI_API(1).jar →1.rm -f HIBIKI_API\(1\).jar ...
2018-07-24 21:05:37 577
原创 read length histogram
1.先统计fastq里面reads length 数目。awk 'NR%4 == 2 {lengths[length($0)]++} END {for (l in lengths) {print l, lengths[l]}}' 91.fastq >read_length.txt 2.用R语言画图读取文件:reads<-read.csv(file="read_leng...
2018-07-22 16:56:28 686
转载 Linux软连接和硬链接
最近在做项目时,看到 ->,百度了下,才知道是软连接。顺便知道了硬链接和软链接的区别。Linux链接分两种,一种被称为硬链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬链接。硬连接硬连接指通过索引节点来进行连接。在Linux的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode In...
2018-07-18 21:17:41 141
原创 基因组从头组装
基因组组装基因组组装一般分为三个层次,contig, scaffold和chromosomes. contig表示从大规模测序得到的短读(reads)中找到的一致性序列。组装的第一步就是从短片段(pair-end)文库中组装出contig。进一步基于不同长度的大片段(mate-pair)文库,将原本孤立的contig按序前后连接,其中会调整contig方向以及contig可能会存在开口(gap...
2018-07-18 21:03:07 6174
原创 对于linux 难删除的文件
这里说的难删除,一般是rm filename ,rm -f filename 都没法删除的文件(考虑过因为权限问题,所以加sudo,还是没办法解决)比如:没法删除\192.168.1.205XXXX.biom文件。解决办法:sudo rm ./*91.biom原因是:前面有转译符/ 会认为是根文件,所以就需要加上./ 。 ...
2018-07-18 12:41:06 228
原创 本地(windows)文件和linux之间的互传
从本地上传文件到linux的方法:1.百度搜索是scp (在ip后面的“:/” 不能有空格)scp /home/administrator/Desktop/old/driver/test/test.txt uesr_name@user_ip:/root/如果是文件夹,在scp后面加一个-r即可2.ftp上传(提示错误,放弃)3.用mount方法,没试过4.用lrzsz 方法...
2018-07-17 18:11:37 269
原创 二代测序文件fastq转换为fasta格式
awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' xx.fastq >xx.fasta
2018-07-16 16:14:59 14098 1
翻译 16S rDNA分析中的qiime脚本
16S是指16S rDNA(或16S rRNA),16S rRNA 基因是编码原核生物核糖体小亚基的基因,长度约1542bp,包括9个可变区和10个保守区,保守区序列反映了物种间的亲缘关系,而可变区序列则能反映物种间的差异。...
2018-07-01 20:42:10 2490 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人