自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

薛猫_柳叶刀

生物的

  • 博客(18)
  • 收藏
  • 关注

转载 Cufflinks的使用

一. 简介Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序。主要用于基因表达量的计算和差异表达基因的寻找。二. 安装Cufflinks下载网页。1. 为了安装Cufflinks,必须有Boost C++ libraries。下载Boost并安装。默认安装在/usr/local。$ tar jxvf bo

2015-04-01 21:51:24 31146

原创 可以下载genome数据的几个网站

Ensembl-plantftp://ftp.ensemblgenomes.org/pub/Ensembl-animalftp://ftp.ensembl.org/pub/NCBI:ftp://ftp.ncbi.nih.gov/genomesUCSC:http://hgdownload.soe.ucsc.edu/downloads.html植

2015-03-26 09:32:35 3346

转载 文件格式之gff3

GFF3是GFF注释文件的新标准。文件中每一行为基因组的一个属性,分为9列,以TAB分开。依次是:1. reference sequence:参照序列指出注释的对象。如一个染色体,克隆或片段。可以有多个参照序列。该id的取名不能以’>’开头,不能包含空格。 2. source :来源注释的来源。如果未知,则用点(.)代替。 3. type     :类型属性

2015-03-16 10:34:20 13590

原创 在命令行获取标准输入序列的反互序列,pep序列和长度信息

最近对序列文件处理的比较多,时常要看一些核酸序列的反向互补序列,长度,可能的翻译序列。以前我常常使用seqBuider 来查看,如果能在命令行直接查看,想必是极好的。这是一个perl脚本,不过我把它的执行路径写入环境变量后,就可以当linux命令直接使用了,很方便的。这个脚本有四个参数。【-i -r -p -l 】其中-i 是必要的参数,用来接收标准输入;-r 是获得一段序列的

2014-09-30 10:21:46 1531

原创 从cds到pep

鉴于有几位同学在问如何批量转化cds为pep序列,那么本人就把自己的一段代码从另一个脚本中抽取出来。故意写成两个子函数是方面单独使用,比如输入序列不是单纯的fasta格式而是phy格式的,可以对cds2pep函数做一下调整,code子函数则无需改动。这段代码要求的输入文件格式是fasta。用法:perl  cds2pep.pl  input.cds.fa  out.pep.fa  #!

2014-08-29 21:39:52 5030 1

原创 用一个简单的perl包轻松管理脚本中的软件调用

在用perl写的流程中,有人喜欢直接在脚本定义软件的路径,比如:my $blastall="/opt/blc/genome/bin/blastall";这样做,看着好像很省事的样子,但是当一个流程层次关系比较复杂时,而且当其中的路径失效时,麻烦来了:我们需要翻复杂的脚本,重新找到标量的定义,然后修改之。可是,当你把所有调用的软件路径写到配置文件中,并用perl package func

2014-08-17 23:22:32 2426

原创 KAAS(KEGG Automatic Annotation Server):一个非常好用的在线注释工具

在基因组学研究中,我们常常需要知道一些基因在整个代谢通路中扮演的角色。日本的KEGG数据库,提供了很全面的基因通路,大大方便了研究者。与此同时,KEGG数据库自身提供了一个方便的在线注释工具,方便又精准,甚至能提供带标注的map通路图,比在本地做blast,然后解析blast结果,再写脚本画map方面了很多。KASS :http://www.genome.jp/tools/kaas/KAS

2014-08-10 23:04:33 17711 2

原创 perl一次读取多行文本的策略

在处理文本时,常常遇到这样的情况:就是我们需要把两行文本做一个比较,然后选择性输出。而在while(){do something}程序块中默认只能一次读取一行。笔者在这里,举一个简单的例子来说明怎么处理这种情况。有一个这样一段文本:a 1 2 3 4a 5 6 7 8a 6 7 8 9a 7 8 9 11a 7 8 9 12a 13 12 14 15a 18 14

2014-08-09 23:38:38 5389

原创 切割fasta文件的几种方案

在做blast,muscle等比对时,对于一个较大的fasta

2014-08-08 18:06:54 8472 2

原创 根据ID列表提取fasta序列

根据基因列表,从总的fasta文件中提取

2014-08-08 17:45:09 12344 3

原创 快速获取两组数据的交集,并集,补集

笔者常用这个脚本快速查看两组数据的交

2014-08-08 17:36:47 4641

原创 随机抽取一定比例的fastq文件

在NGS的下机数据中,我们通常抽取一些fq文件,做

2014-08-08 17:27:18 4420

原创 滑窗口统计基因组GC含量的分布

在基因组学常规分析中,滑统计GC含量是一个

2014-08-08 17:09:31 7982 1

原创 从gtf到gff

从Ensemble数据库中下载到的基因组坐标文件通常是

2014-08-08 17:04:00 3943

原创 从NCBI基因组数据中获得cds,pep和geneID对应表

A perl script deal with ncbi raw data,and from which get cds ,pep and gene,mRNA and protein ID list.

2014-08-08 16:52:34 15414

原创 数字之美

这是一个实现多种特征数筛选的perl脚本,有点意思。

2014-08-08 15:44:58 691

原创 利用施瓦茨排序获得范围数据的并集

有一个文件gi.txt是这样的:abc     38449   25480-25548 25189-25245abc     24548   6408-6446abc     209928  28985-29312 29715-29736abc     396277  205294-205311 394789-394806abc     290118  77

2014-08-08 14:54:11 620

原创 利用perl或者R实现不规则文本的行列转置

如下是一个不规则的文本(行列中有空缺位),将其行列转置,求新的文本。Array.lst:1       aa      bb      cc      dd2       re      uy      oo      jj3       uh      njk     kjh     jll4       bgjkh   klllj   hhgj    k

2014-08-08 14:34:44 2690

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除