生物
文章平均质量分 65
morningCV
喜欢电脑技术,喜欢结交朋友
展开
-
perl应用:SNP的提取(3):18个样品SNP的合并join.pl,+忽略-多的行
在(2)中我们只是取出了一个sample的snp位点,我们的想法是把所有的SNP位点统计到一个文本里面,这样,我们就可以看出哪些SNP位点的出现的频率更大。也就是哪些是真正的SNP位点,只出现在一个样品中的SNP位点,有可能是因为测序不准,导致的假阳性。思路如下:1.先打开第一个样品的snp位点,然后将snp在ref的位置和碱基作为hash的key,然后把样品的碱基作为value。2.原创 2012-11-21 18:57:50 · 2813 阅读 · 0 评论 -
Affymetrix生物芯片解决方案概述
Affymetrix公司作为全球销量第一的基因芯片厂家,以其完备的芯片设计,稳定可靠的分析结果和强大的生物信息学分析能力,帮助研究人员在最短的时间内获得大量可靠的结果,为后续研究提供重要的线索和帮助。Affymetrix公司目前已经在纳斯达克上市,在基因芯片领域中成为行业标准。 Affymetrix公司的巨大优势在于为客户提供“完整的基因芯片解决方案”,即提供全套的基因芯片相关产品。 包转载 2013-05-29 16:40:33 · 5113 阅读 · 0 评论 -
聚类分析软件操作流程
2011/2/24背景简介:在芯片数据聚类分析中,可用的软件有很多,其中最重要的软件就是Cluster和它的相关树可视化软件TreeView。 软件下载:那如何获取这两款软件呢?以下为两款软件的获取地址:http://bonsai.hgc.jp/~mdehoon/software/cluster/选择Cluster 3.0 for windows 和 JavaTre转载 2013-06-07 10:59:59 · 4791 阅读 · 1 评论 -
samtools得到mapping中各个位置覆盖度情况程序,samtools tview的使用
use strict;use warnings;system 'samtools tview /home/blackstar/lastz/GRC/Yeast/share/02.assembly/00.novoalign/yeast_set1/H1_1/H1_1_Clean.S288C.novo.pe.dedup.bam /home/blackstar/lastz/GRC/Yeast/sha原创 2013-03-30 16:45:20 · 7066 阅读 · 0 评论 -
GenomePixelizer使用总结
Table of Contents1 神灯软件的使用总结(GenomePixelizer)1.1 运行所需要的文件1.2 输入文件的格式1.3 图片的生成1.4 总结,现在暂时使用的是这些,以后有其他的用处再进行补充。1 神灯软件的使用总结(GenomePixelizer)这是一款生物分析类型的软件。从开始到现在我使用到功能只有其中的一 个功能,也就原创 2013-04-29 22:43:41 · 2748 阅读 · 0 评论 -
根据位置从gff中提取gene
小程序-根据位置从gff中提取geneTable of Contents1 需要的文件格式2 程序1 需要的文件格式1: 染色体 位置2 程序 1: use strict; 2: use warnings; 3: 4: my (@information,$chr,%hash,$key1,$key2,); 5原创 2013-06-29 22:51:23 · 10281 阅读 · 1 评论 -
水稻基因命名
RGAP:基因命名法 在访问水稻基因组注解计划的FTP地址或网页上的模拟分子数据时,会见到其内部使用的术语,如TU和基因模块。这篇文章旨在解释此计划的命名法,并且将其与生物学家普遍使用的命名法联系起来。 转录单位: 一个转录单位相当于一个基因或模拟分子上的一个基因座。转录单元以一种精确的命名规则储存在数据库中,合适名字如:x.tyyyyy 。其中,x指的是BAC或模拟分子的收录编原创 2013-08-27 10:12:12 · 7161 阅读 · 0 评论 -
Mega的简单使用
Table of Contents1 Mega画树的简单应用2 fas格式文件的准备3 用生成的.meg画树4 生出树的处理4.1 修改内容,添加标注4.2 导出4.3 后面随着学习的进行继续修改,增加。1 Mega画树的简单应用2 fas格式文件的准备首先我们要准备的就是fas的需要进行画树的序列。这个自己根据需要生成。 我们用me原创 2013-08-30 16:25:05 · 6890 阅读 · 0 评论 -
Dnasp计算LD
Dnasp计算LDTable of Contents1 Dnasp 计算LD1 Dnasp 计算LDDnasp有很多的功能,现在主要来记录其计算LD的功能。 首先File——然后打开data——然后在Data中Format里设 置格式,也就是你读入的文件是什么样子的,进行一个 描述。我们这里选DNA,Haploid,然后OK,然后到Ana lysis找到原创 2013-09-01 21:09:11 · 2793 阅读 · 0 评论 -
酵母同义和非同义的snp的程序
use strict;use warnings;my $filename;my @filename;my $i;#氨基酸hashmy(%genetic_code) = ( 'TCA' => 'S', # Serine 'TCC' => 'S', # Serine 'TCG' => 'S', #原创 2013-09-02 18:37:32 · 2054 阅读 · 0 评论 -
酵母同义和非同义的snp的程序
use strict;use warnings;my $filename;my @filename;my $i;#氨基酸hashmy(%genetic_code) = ( 'TCA' => 'S', # Serine 'TCC' => 'S', # Serine 'TCG' => 'S', #原创 2013-09-02 18:36:02 · 2786 阅读 · 0 评论 -
Circos入门教程
Circos入门教程一定要第一时间将看到的东西,放在自己随时能找到的范围,自己的博客,空间内,以便于随时查阅2011年12月18日 ⁄ Bioinformatics ⁄ 评论数 2 ⁄ 被围观 1,697 views+安装前的一些准备Config::GeneralFile::BasenameFile::Spec转载 2013-09-12 21:25:17 · 9036 阅读 · 2 评论 -
Excel不同列多条件计数
=SUMPRODUCT(($C$1:$C$10000="hete->s288c")*($H$1:$H$10000s288c")*($H$1:$H$10000=SUMPRODUCT(($C$1:$C$100000045000)*$U$1:$U$1000000)条件的求和复制excel中的公式,而不是公式后得到的结果假设公式在 A列选中A列, 按原创 2013-03-08 21:26:54 · 6859 阅读 · 0 评论 -
GFF格式说明
GFF3是GFF注释文件的新标准。文件中每一行为基因组的一个属性,分为9列,以TAB分开。依次是:1. reference sequence:参照序列指出注释的对象。如一个染色体,克隆或片段。可以有多个参照序列。2. source :来源注释的来源。如果未知,则用点(.)代替。3. type :类型属性的类型。建议使用符合SO惯例的名称(sequence转载 2013-02-23 21:08:43 · 9035 阅读 · 0 评论 -
Phylip进化树的使用,偏重于文件格式的获取
Phylip进化树的使用,偏重于文件格式的获取Table of Contents1 关于这个软件2 mix.exe格式3 pars.exe4 附录:phylip软件子程序说明1 关于这个软件这个软件包含的内容很多,里面有许多的程序。后面我会附上我从别处看到的一 个总结,这里我们只是侧重于,对于这些程序所需要的输入文件的格式进行说明, 并讨论具体的实现方法原创 2013-04-30 13:51:28 · 8647 阅读 · 0 评论 -
酵母端粒位置信息
TEL01L 1 801TEL01R 229411 230218TEL02L 1 6608TEL02R 812379 813184TEL03L 1 1098TEL03R 315783 316620TEL04L 1 904TEL04R 1524625 1531933TEL05L 1 6473TEL05R 569599 576874TEL06L 1 5530原创 2013-04-15 19:46:42 · 1982 阅读 · 0 评论 -
序列拼装软件:stampy的使用方法
首先大家可以到我的资源里面去下,也可以google“stampy”然后需要填写邮箱等信息,然后给你发链接,然后才能够下载。我们在linux下首先要某个文件夹下进行解压缩,具体的解压缩方法看上一篇文章。我们这里在学习过程中做一些记录,以便后来翻看。可能要解压两次。解压好了以后需要到文件夹里面,然后里面有个readme的东西,你读读,安装的方法就是make一下。也就是在目录下,打开命令行,然后原创 2012-11-26 18:57:26 · 3811 阅读 · 0 评论 -
利用ultraedit打开超大文件 G以上级别的简单配置
要想打开很大的文件,你要进行一下简单的配置:高级——配置——临时文件——原创 2012-11-26 19:10:54 · 28793 阅读 · 0 评论 -
perl应用:SNP的提取(2):从对比序列中找到SNP位点并输出 a.pl
我们从第一步中得到的是一个如下的文件:##maf version=1 scoring=lastz.v1.02.00# lastz.v1.02.00 --ambiguous=iupac --notransition --step=20 --nogapped --format=maf ## hsp_threshold = 3000# gapped_threshold =原创 2012-11-21 16:34:30 · 7987 阅读 · 2 评论 -
perl应用:SNP的提取(4):信息的补全all.pl和重复区域的删除repeat_move_all_information.pl!
我们在上一篇文章中看了最后的输出结果如下:pos TAIR bur can ct edi hi kn ler mt no oy po rsch sf tsu wil ws wu zu 1000 G - A - - - - - - - - - - - - - - - -10000003 C - - - - - G - - - - - - - - - - - -10000013 A -原创 2012-11-21 20:49:26 · 1833 阅读 · 0 评论 -
标准核酸代码表
标准核酸(DNA、RNA)代码(符号)表Standard IUB/IUPAC nucleic acid codes (symbols) tableCode Nucleic Acid(s)A---- AdenineC---- CytosineG---- GuanineT---- ThymineU---- UracilM---- A or C (amino)R-原创 2012-11-21 16:09:01 · 5526 阅读 · 0 评论 -
blastall的使用方法,以及输出文件的格式记录
用blastall进行序列比对 blastall是最常用的blast程序之一,其功能非常强大,其下面有非常多的参数,但是一般使用的参数如:-p、-i、-d、-o、-e等几个。-p: 执行的程序名称-d: 搜索的数据库名称-i : 要查询的序列文件名(Query File)-e:(数学)期望值(Expectation value),E值是原创 2013-01-07 17:29:11 · 13593 阅读 · 0 评论 -
一个R程序,表达差异基因:探针分析
library(RankProd)#打开这个库TanZhen <- read.table("f:/r/L2_9311_LYP9/L2_9311_LYP9_1.txt",header=FALSE)#读入数据,这个数据要处理以后的,用read.csv读入以后是错误的#attach(TanZhen)#挂载数据#detach(TanZhen)#不用了将其挂起。#head(TanZhen)#nam原创 2013-01-11 10:32:17 · 3823 阅读 · 0 评论 -
转载:教程:在NCBI批量Blast
本文全文转载子云生物:http://yunbio.com/49先要多谢一下 Sophie 与 rebeccajiejie 的热心,让 云生物 看起来着实有些了活力。也希望更加的人参与进来回答问题。得开始认真宣传一下才行啊。最近Sophie问了我关于批量Blast的问题。我尝试了一下NCBI的批量Blast,感觉非常不错。 写个教程分享一下。拿水稻的序列Blast做个例子。转载 2013-02-23 18:32:58 · 17686 阅读 · 0 评论 -
bed文件格式(转自http://blog.sina.com.cn/s/blog_70b2b6020100liou.html)
我们先在最需要的就是前面的三个参数,第一个,染色体的编号:这个形式根据你的ref文件来确定然后染色体上的起始位置,将如是5000,那么程序将从5001开始计数。然后染色体上的终止位置,加入是5500,那么就是截至到5500BED 文件格式 BED 文件格式是一个可变方式的数据线,用来描述注释的数据。BED线有3个要求的字段和9个额外的转载 2013-03-30 16:33:18 · 3092 阅读 · 0 评论 -
samtools学习及使用范例,以及官方文档详解
本文章主要参考“菜鸟”的新浪博客,自己只是把自己操作的过程记录下来,供大家参考。#第一步:把sam文件转换成bam文件,我们得到map.bam文件system"samtools view -bS map.sam > map.bam";#第二步:sort 一下 BAM 文件,得到map.sorted.bamsystem"samtools sort map.bam map.sorted"原创 2012-12-04 11:24:02 · 19259 阅读 · 0 评论 -
如何使用Mega cc
如何使用Mega ccTable of Contents1 github地址:2 下载3 使用3.1 安装3.2 输入文件3.3 输出文件3.4 运行MEGA-CC3.5 MEGA-Proto (分析模版)3.6 Demo1:实例13.7 Demo2: 实例23.8 自我实例4 mao 文件简单解析5 在Linux下如何使用1 github地址:原创 2014-03-30 19:25:23 · 10766 阅读 · 0 评论