![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息
ypfzhao
这个作者很懒,什么都没留下…
展开
-
生物信息数据存放类型之——FASTQ
FASTQ简介FASTQ用于保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。 其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发。 目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的实施标准。一、定义和示例FASTQ文件中每个序列通常有四行:第一行是序列标识以及相关的描述信息,以‘@’开头 第二行是序列第三行以‘+’开头,后面是序列标示符、描述信息,或者什么也不加,但是“+”不能少。第四行,是质量信息,和第二行的序列相对应,每一原创 2020-06-02 20:10:39 · 7441 阅读 · 1 评论 -
最新ncRNA数据库大全(含TCGA、ceRNA、exosome等)
一、TCGA相关数据库 数据库名 网址 备注 TCGA-GDC https://portal.gdc.cancer.gov/ TCGA官网 GEPIA http://gepia.cancer-pku.cn/ 北大Zhang lab-Zefang Ta...转载 2019-01-04 10:27:24 · 21997 阅读 · 2 评论 -
教程 | 如何用cd-hit去除冗余序列?
0.简介 生信分析中经常要根据指定条件查找相似序列,比如构建多个样品间的非冗余基因集、分析样品间的相似程度等等,cd-hit这款软件就可以用较短的时间解决此类问题,可以对单个数据集进行去冗余,包括DNA/RNA序列和蛋白序列,也可以对两个数据集进行比较。其工作原理可概述为:将所有序列按照参数设定进行聚类,并将每一组聚类中的最长序列作为代表序列进行输出,同时给出每组聚类下的每个序列名可供相似度分...原创 2018-11-07 15:50:01 · 41391 阅读 · 8 评论 -
bowtie和bowtie2使用条件区别及用法
一、转录组还是基因组?map常用的工具有bowtie/bowtie2, BWA,SOAP1/SOAP2等。这个问题又会被分成两个问题,是基因组测序(DNA-seq)还是转录组测序(mRNA-seq)。其中的区别是对于真核生物而言,mRNA序列与DNA序列并不完全相同,在经历了后剪切之后,成熟的mRNA可能是原基因的一部分,甚至顺序及个别碱基会产生变化。如果是mRNA测序,那map工作就会在DN...转载 2018-11-07 15:17:58 · 11546 阅读 · 0 评论 -
bowtie和bowtie2用法详解
bowtie 短序列比对工具详解常见的短序列比对工具有很多,如fasta、blast、bowtie、shrimp、soap等。每个工具都有其自身的优点,但同时也具备了一些缺点。权衡利弊,我选择bowtie作为主要的短序列比对工具。它速度很快,比对结果也容易理解。现在举个例子来探讨bowtie的使用方法:现在有GENOME.fa、高通量测序数据Reads.fa,我们希望将Reads.fa比对到...转载 2018-11-07 15:16:10 · 16355 阅读 · 0 评论 -
高通量测序的方式:单端测序、paired-end/mate-paired(PE/MP)测序 解释
高通量测序的方式主要有:单端测序、paired-end/mate-paired(PE/MP)测序。当要进行多 个样品同时测序时可以给不同的样品添加不同接头,混合后一起测序。 其中单端测序就是将 基因组随机打断后,对每个片段的进行测序。该方式建库简单,操作步骤少,常用于小基因 组、转录组、宏基因组测序。 PE/MP 测序也叫双向测序,是对一个长的序列测得其两端的序...转载 2018-11-07 15:13:41 · 10741 阅读 · 0 评论 -
生物信息学数据库资源 {#database}
目录 ##前言参考基因组版本 {#genome-version}NCBIEnsemblUCSCENCODEGENCODETCGA1000 GENOME##前言做数据分析常常会需要用到参考基因组和注释文件,还会需要分析公共数据,了解常见的生物信息学数据库资源也是非常有必要的!故本章首先介绍常用的参考基因组和注释文件,然后介绍生物信息常用的数据库资源如:...转载 2018-11-06 19:54:20 · 19187 阅读 · 4 评论 -
生物信息编程实战题
目录 1.生信编程很简单编程语言系统入门题目下载安装bowtie2(内含测试数据)2.人类基因组的外显子区域的长度题目测试数据R实现代码示例3.hg19基因组序列的一些探究题目测试数据Perl代码示例参考结果{-}4.hg38每条染色体的基因、转录本分布题目测试数据代码示例5.多个同样行列式文件的合并题目模拟数据...转载 2018-11-06 20:07:30 · 8549 阅读 · 0 评论 -
生物信息(bioinformation)学名词解释
什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能...转载 2018-11-07 15:08:40 · 9258 阅读 · 0 评论