自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(7)
  • 收藏
  • 关注

原创 群体遗传中SNP评估pie值的计算

snp的分析中,有需求算pie值和theta值,也就是核苷酸多样性指样本中所有可能匹配成对的序列间核苷酸位点差异百分比的平均值,用π值表示。以及核苷酸多态性,是指从基因组中所研究的DNA区域中抽取任何样本,核苷酸位点是核苷酸多态位点百分比的期望值,常用θ表示。

2015-07-16 22:06:56 3495

原创 哈希表解决提取reads问题

问题描述,有两个文件,一个是基因和其相对应所包含的readsID以及是正反向测序是否都要的标识。格式如下:Tea_CCG055929.1&FCC55J8ACXX:8:1101:6302:2021#TAGCTTAT/1&A基因名&reads名&标识。如果A则正反都要,如果S则只要一条。另一个则是reads文件标准fq格式。依据关键字文件找出对应的reads序列存入相应

2015-04-18 10:23:59 556

原创 通过GeneId在NCBI上批量搜寻序列

当你有大批量的GeneId序列的时候,手动一个个在NCBI里面比对肯定是不现实的,本来有Batch Entrez方便批量比对,可是总容易不允许进入。所以写了以下一种流程可以批量比对。首先如果是比对蛋白质(protein)或者(nucleotide)数据库 ,那很容易 用perl以下代码即可。#!/usr/bin/perl -wuse Bio::SeqIO;use Bio::DB::Ge

2015-04-06 11:11:58 2032

原创 精确匹配线性时间复杂度经典Z值试算

最近看了Z算法。发现一些算法问题还是经过自己编程理解的更好点。问题是如何 在一段字符串中精确匹配一小段字符串。比如 AGA匹配GAGAG 先算AGA$GAGAG 的Z值 也就是各个字符和前缀匹配最长的长度值。按我一般理解 我给出的Z值算法输入数据:长度为m的字符串S输出数据:字符串S的Z值Z[1..m]1.for k=1 to m do2.初始化匹配个数q=0.3.

2015-04-01 10:54:44 379

转载 blast2go windows 下本地化

1.准备工作安装MySQL;参考:http://jingyan.baidu.com/article/597035521d5de28fc00740e6.html点击打开链接安装完毕后进入mysql中建立个新用户sa(注:用户名随意)密码123(随意)mysql>create user sa identified by '123';并附权限。mysql>grant

2015-03-17 08:19:36 1461 1

原创 一个处理fasta标题的小程序

问题:有一个fasta文件,其中>后面只有名字,现在要依据另外一个txt文件将附属说明添加到对应名字中。解决:用perl很方便的可以解决。思路:1、先打开txt文件,读取关键字和附加说明。2、再打开fasta文件,将关键字和>后面的名字对比。如果相同就将附加说明添加上去。并将其后面的序列重新写入新的文件中。这一块用了flag标识。0代表未匹配状态,1代表已经匹配,2代表链接完后

2015-03-04 10:44:48 484

原创 针对blast特定案例下批量处理程序

问题为:首先数据源是已经处理掉引物并且拼接好的单条碱基。需要通过BLAST比对得到其Features是否属于特定蛋白质?BlAST比对采用perl连接远程BLAST从而进行批量比对。首先对数据源处理将所有数据放到一个FASTA文件中。#!/usr/bin/perluse strict;use Bio::SeqIO;use Getopt::Long;my $dirna

2015-02-07 01:47:48 493

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除