自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Augustus操作指南

Augustus指南(Trainning部分)目录Augustus指南官方 Tutorial IndexInput:Trainning:PredictionOutput:可能用到的其他软件Trainning Augustus对于没有直接基因结构的情况,可以使用Scipio制作基因结构文件将用于Trainning的基因结构信息分为Trainning set和test set...

2019-09-23 15:59:10 7508

原创 Genscan操作实战

Genscan指南GenScan是一个gene识别软件,主要是通过已知生物的基因结构特征来识别新的基因(parse)。所利用的基因特征请参看readme文件。特点:只考虑编码蛋白的基因。模型考虑每个sequence可能有0个,1个,多个,甚至双链都有基因。假设transcription units没有overlapping。Input:基因组序列Output:文本文件:识别出来的...

2019-09-23 15:56:05 5326 1

原创 组装好基因组后之预测基因

预测基因给定一段fasta格式序列,如何预测其中的基因呢?首先需要判断该片段来自原核生物,真核生物还是病毒序列。如果是原核生物,基因结构比较简单,可以直接使用prodigal或者glimmer3工具进行预测。直接将fasta格式序列输入给软件即可。prodigal -a ref.pep -d ref.cds -f gff -g 11 -o ref.gff -s ref.stat -i re...

2019-09-21 13:58:18 3434

转载 基因家族鉴定分析实战操作手册

基因家族鉴定分析操作手册:基因家族 基因家族鉴定基因家族鉴定分析总结

2019-09-14 15:18:45 15894

原创 TCGA数据中如何区分样本是癌症还是癌旁

TCGA的样品编码方式(barcode)

2019-09-14 14:37:34 13336

原创 ABYSS genome assemble 详细用法

ABySSABySS is a de novo sequence assembler intended for short paired-end reads and large genomes.Please cite our papers.News3 May 2019Looking for a fun & worthy challenge? Think you can contr...

2019-09-23 13:04:25 1410

转载 高通量测序的方式解析:单端测序、paired-end/mate-paired(PE/MP)测序

高通量测序的方式主要有:单端测序、paired-end/mate-paired(PE/MP)测序 高通量测序的方式主要有:单端测序、paired-end/mate-paired(PE/MP)测序 [8] 。当要进行多 个样品同时测序时可以给不同的样品添加不同接头,混合后一起测序。 其中单端测序就是将 基因组随机打断后,对每个片段的进行测序。该方式建库简单,操作步骤少,常用于小基因...

2019-09-22 22:29:18 1730

转载 XShell 的命令提示符颜色配置

设置提示符格式—PS1在终端上的显示的命令提示符:[root@zhang ~]#配置文件中的设置:PS1=”[\u@\h \W]$”PS1的定义中个常用的参数的含义如下:\d :#代表日期,格式为weekday month date,例如:”Mon Aug 1”\H :#完整的主机名称\h :#仅取主机的第一个名字\T :#显示时间为24小时格式,如:HH:MM:SS\t :#显示...

2019-09-22 16:46:32 1565

原创 grep-sed-awk

18、grep文本搜索工具,类似于正则表达式搜索,可以在一个大的文件中快速搜索到满足一定规则的内容。#案例一:统计fasta文件中序列的条数;grep -c “>” gene.ffn#案例二:输出满足条件的序列;grep -A 2 “3 gi 29732 34486” lastz.axt#案例三:筛选出不满足条件的内容;ps -fx | grep -v “S”19、sed...

2019-09-22 15:41:14 206

原创 压箱底的Linux技巧

Linux的强大之处就在于它的批量化和自动化,能够高效的完成工作,即使比较复杂的工作,通过一条命令就能够快速完成,另一方面,Linux系统相对完善,只要你能想到的功能,只要耐心去搜索,都能够找到比较好的解决方案。这里我们介绍一些平时我工作中常用中Linux技巧,可以极大提高我的工作效率,如果你有更好的技巧,也欢迎留言给我。timetime命令可以用于计算任务消耗时间,只需要在执行命令前面加上t...

2019-09-21 15:35:34 108

原创 sed 处理fasta/q 文件

sed 是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在称为“模式空间”(pattern space)的临时缓冲区中,接着用 sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。生成联系文件leadingsci@DELL5577:~/Test$ cat df.txtFilesystem Size Use...

2019-09-21 10:44:47 883

转载 生物信息,神奇有用的单行命令!

Bioinformatics one-linersDOIUseful bash one-liners useful for bioinformatics (and some, more generally useful).ContentsSourcesBasic awk & sedawk & sed for bioinformaticssort, uniq, cut,...

2019-09-20 22:03:31 603

原创 samtools faid产生的.fai文件详解

区别samtools faidx产生的.fai文件功能和bwa index 产生的四个文件的功能samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fasta文件, 能够快速的提取任意区域的序列用法:samtools faidx input.fa该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度...

2019-09-20 18:12:13 6874 1

原创 sra-tool 中的prefetch更改下载文件的保存路径

sra-tool 中的prefetch更改下载文件的保存路径(一切皆是命令行操作)首先找到你安装sra-toolkit的路径,然后打开bin文件夹,在当前文件夹输入如下命令:./vdb-config -i接着查看官方的操作(点击转到官方链接)。可以用鼠标控制选项,然后按回车键确认,如果想要保存需要用tab键,最终还是要跳到最开始的对话框,鼠标点击到[6 save],回车确定保存,然后[7 e...

2019-09-19 19:44:01 2242

原创 DESeq2 设置多线程并行计算,可大大提高运行效率

#运行时间明显缩短了,尤其在样本数据多时非常明显。

2019-09-18 23:08:51 1005

原创 bed 文件说明

bed文件(browse extensive data)以及gff文件(general fearture format) ben文件第一列是染色体或者contig信息。第二列是起始位置,从0开始。第三列是终止位置。前三列是必须的!第四列是bed列的名字。第五列是score。第六列是链方向。第七列是基因起始。第八列是基因终止。第九列是RGB值。第十列是外显子数量。第十一列是外显子大小。第十二列是外显...

2019-09-13 18:04:02 2365

原创 awk打印指定列以后的所有列

现在想打印除了第一列意外的所有列文件内容:[root@localhost ~]# cat test.txt1 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 01 2 3 4 5 6 7 8 9 01 2 ...

2019-09-13 14:28:52 4134 1

转载 awk打印时里面加引号或者其他符号

awk打印时里面加引号或者其他符号1、添加双引号使用"“双引号把一个双引号括起来,然后用转义字符\对双引号进行转义,输出双引号。awk '{print “””}’2、添加单引号使用一个双引号"",然后在双引号里面加入两个单引号’’,接着在两个单引号里面加入一个转义的单引号’,输出单引号。awk ‘{print "’’’"}’栗子如下:命令:cat huangzx3|awk -F"...

2019-09-10 19:59:32 1643

原创 awk当中使用外部变量

awk当中使用外部变量1.awk命令使用双引号的情况下此时在awk命令里面使用"$var"就可以引用外部环境变量的var的值var=“BASH”;echo"unixscript"|awk"gsub(/unix/,“var”)"2.awk命令使用单引号的情况下此时在awk命令里面使用"’"$var"’"就可以应用外部变量var的值,注意五个点表示两个双引号之间有一个单引号var=“BAS......

2019-09-10 18:58:53 5831

原创 解释外显子,内含子,CDS、cDNA、EST、mRNA、ORF间的区别

外显子、内含子、mRNA、CDS1.DNA复制:以DNA为模板,在DNA聚合酶的催化作用下,将四种游离的dNTP按照碱基互补配对原则合成新链DNA转录:以DNA为模版,在DNA指导的RNA聚合酶的作用下,将四种游离的NTP按照碱基互补配对的原则合成RNA翻译:以mRNA为模板,在核糖体内合成蛋白质的过程特点:DNA复制 模板为双链DNA,合成的新链与模板链一模一样,原料为四种dNTP,为...

2019-09-10 10:19:17 34023

原创 各种统计检验及r语言实现

1.单正态总体的检验方差已知,检验均值:Z检验z.test():BSDA包,调用格式:z.test(x, y = NULL, alternative = “two.sided”, mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)x,y为样本数据,单样本时忽略y;alternative选择检验类型;mu为检验的均值;sigm...

2019-09-02 21:28:55 6719

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除