bioinfo
文章平均质量分 51
biubiuv
关注bioinfo,perl,c/c++,big data
展开
-
BED文件格式
BED 文件格式 BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致。必须包含的3列:chrom, 染色体或scafflold 的名字(egchr3, chrY, chr2_random,scaffold0671 )chromStart 染色体或scaffold的起始位转载 2014-10-21 17:19:57 · 12480 阅读 · 3 评论 -
COG数据库介绍【转】
Cluster of Orthologous Groups ofproteins(COG)介绍》》》NCBI资源介绍什么是COG? “COG”是Cluster of Orthologous Groups ofproteins(蛋白相邻类的聚簇)的缩写。构成每个COG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或者是paralogs。Orthologs是指来转载 2014-10-21 17:19:51 · 10035 阅读 · 0 评论 -
FASTQ文件详解【转】
FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的事实标准。格式说明FASTQ文件中每个序列通常有四行:序列标识以及相关的描述信息,以‘@’开头;第二行是序列第三行以‘+’开头,后面是序列标示符、描述转载 2014-10-21 17:19:32 · 10600 阅读 · 0 评论 -
BLAST中的E值的理解
一般的,当我们使用BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序)时,我们会注意到这里有一个E值。那么这个Evalue是什么呢?怎么来理解这个值呢?下面是一个平常的blast结果,Sequences producing significantalignments:Score (S)Egi|83574104|Moth_2374|sporu转载 2014-10-21 17:19:49 · 20022 阅读 · 2 评论 -
RNA-seq测序数据(reads)提交NCBI
RNA-seq测序数据(reads)提交NCBI RNA-seq的测序数据要向NCBI提交,这里简单总结一下。原始的测序数据(reads) 数据要提交到SRA. RNA-seq的拼接结果应该提交到TSA库,TSA全称TranscriptomeShotgun Assembly Sequence Database,TSA isan archive of computationally as转载 2014-10-21 17:19:59 · 10227 阅读 · 1 评论 -
SAM格式说明
转自博耘生物SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。不同的软件,不同的时期,不同的研究方向,都会创建一种或者多种格式标准,当然根据当时的需要,创建符合需求的标准,也是最容易的事情,而反过来想要真正的理解标准,也必须理解为什么要创建这样的标准,解决什么样的需要转载 2014-10-21 17:19:55 · 1307 阅读 · 0 评论 -
当我们谈论基因,我们在谈论什么
本文转自:昨天发玩儿关于“只有少数人用用blablabla基因”的吐槽文,工号九千多的BGI新员工玄澄问我,“基因是什么”。我的回复是“这真是一个很困难的问题”。作为节操导师,我不能随随便便就误导和打发了一个新员工,嗯,没错是这样,顺便在收入多于我几倍的新员工面前装装逼什么的。我不知道“基因”是什么,或者说,我其实不知道我们每个人在每种语境下所谓的“基因”是什么。【当我转载 2014-11-21 08:58:10 · 874 阅读 · 0 评论 -
生物信息学的基本课程学习
1、数学:高数(上册,下册)、线代、概率论、随机过程,离散数学;2、生物:普通生物学、生物化学、分子生物学、细胞生物学、遗传学、基因组学、蛋白组学等;3、计算机:计算机基础、C语言、C++、JAVA、Perl、数据结构、数据库、数据挖掘、计算机算法、软件工程。这是最基本的,根据方向还有其他很多要学习的。原创 2014-10-21 17:19:26 · 1460 阅读 · 0 评论 -
SAM得到完美匹配(perfect match)
主要针对bwa生成的sam文件中,如何找到完美匹配的比对结果。原创 2017-02-22 15:03:49 · 7946 阅读 · 0 评论