- 博客(39)
- 资源 (16)
- 收藏
- 关注
转载 转录组测序
转录组测序 转录组测序分析可以分为referring sequencing有参转录组分析和de novo无参转录组分析。有参无参的意思是,有/无参考基因组。 1.获得测序数据,Fastq格式,称之为Raw data。Fastq文件说明;每四行为一个单元。第一行:序列名称第二行:序列的碱基第三行:序列名称,可以使用+代替第四行:碱基的...
2019-05-23 17:09:00 2185 1
转载 拼接( read----contigs)和组装(contigs---Scaffolds)
DNA是生物体遗传信息的主要载体,高质量的基因组参考序列是现代遗传学、分子生物学等现代生物学科的重要基础。因此,基因组测序对探索与认识生命本质等基础生物科学研究、人类重要遗传病防治及动植物遗传育种等应用性研究均具有十分重要的意义。基于二代测序技术,又称下一代测序技术(Next generation sequencing,NGS)的全基因组测序工程一般包含两个部分:拼接和组装,...
2019-05-23 17:01:57 12128
转载 全基因组测序的优势
全基因组测序的优势目前,随着高通量测序技术快速发展、测序成本的进一步降低以及组装方法的不断完善,全基因组测序研究主要包括3个方面。第一种为不参考任何现有序列从头组装测序,是对未知基因组序列的物种进行基因组测序,并综合利用不同测序技术和生物信息学工具对研究物种进行序列拼接和修正,进而获得该物种的基因组序列图谱。第二种为常见的全基因组重测序,是对已知基因组序列的物种进行个体或群体的测序研究,建...
2019-05-23 16:57:46 7087
转载 测序是测量你的遗传信息
测序是测量你的遗传信息遗传信息,大家应该都清楚,如果不清楚的话麻烦各位翻一翻高中的肺炎双球菌实验,讲的就是啥是遗传信息,如何发现遗传信息的。放张图,方便大家回忆。原来的科学家们通过老鼠死没死,最终得到的结论是DNA是主要的遗传物质,部分物种的遗传物质是RNA。在弄清楚这个事情之后,大家也都知道沃森和克里克还有一些被遗忘的科学家一起努力弄清楚了DNA是双螺旋结构。并且(A-T,G...
2019-05-23 16:51:06 2946
转载 DNA 测序技术
DNA 测序技术用以分析特定DNA 片段的碱基序列(腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤(G))的排列方式.图2 DNA 测序及拼接过程示意图Fig. 2 Diagram of DNA sequencing and assembly测序完成后的第一步也是最重要的一步就是根据读序拼接回贴成完整的序列,其测序与拼接过程如图2 所示.拼接算法用于将测出的读序拼接成完整的染...
2019-05-20 16:44:31 2336
转载 什么是RNA-Seq (RNA Sequencing)
什么是RNA-Seq (RNA Sequencing)2011-07-14~ADMIN随着ome为词尾的各种组学的出现,转录组学已经成为了人们了解生物信息的一个重要组成部分。人们使用了许多办法来掌握转录组的情况,主要分为两类,一类是基于杂交,一类是基于下一代测序技术(Next Generation Sequencing, NGS)。基于杂交的办法,主要是依靠印刷有荧光标记探针的基因...
2019-05-19 19:25:09 10624
翻译 从RNA-seq结果到差异表达
从RNA-seq结果到差异表达2011-09-12~ADMIN翻译自:From RNA-seq reads to differential expression, Oshlack et al. Genome Biology 2010, 11:220高通量测序技术,也就是下一代测序技术已经成为现代生物学研究的一个较为常规的实验手段了。这一技术的发展极大地推动了基因组学,表观基因组学以...
2019-05-19 18:44:58 3742
转载 短序比对工具 bowtie vs BWA vs Subread vs SOAP vs NovoAlign
短序比对工具简介bowtie vs BWA vs Subread vs SOAP vs NovoAlign2013-07-08~ADMIN有趣的是,大部分的short read比对工具都是由中国人写出来的。因此可以说华大基因(BGI, Beijing Genomics Institute, Chinese Academy of Science)是中国NGS测序技术的摇篮。速度上较有...
2019-05-19 18:40:40 2036
转载 序列拼接工具Bowtie使用说明
序列拼接工具Bowtie使用说明2011-06-08~ADMINBowtie是一个超级快速的,较为节省内存的短序列拼接至模板基因组的工具。它在拼接35碱基长度的序列时,可以达到每小时2.5亿次的拼接速度。Bowtie并不是一个简单的拼接工具,它不同于Blast等。它适合的工作是将小序列比对至大基因组上去。它最长能读取1024个碱基的片段。换言之,bowtie非常适合下一代测序技术。...
2019-05-19 18:39:42 2272
转载 序列拼接
序列拼接29 Oct 2016故事从Self的一个bug说起。在Self中,序列的拼接是由traits indexable的joinUsing:方法实现,具体行为是以某一分隔符将序列组拼接为单一序列。Self原先的实现是以序列的第一元素类型作为返回值的类型。这样如果组中没有任何序列,joinUsing:不是返回一个空白序列,而是报empty collection error的错误。在报...
2019-05-19 18:36:01 3588
转载 序列比对-BLAST
一.BWABWA主要是将reads比对到大型基因组上,主要功能是:序列比对。首先通过BWT(Burrows-Wheeler Transformation,BWT压缩算法)为大型参考基因组建立索引,然后将reads比对到基因组。特点是快速、准确、省内存。由三种类似算法组成:BWA-backtrack,BWA-SW和BWA-MEM。首推BWA-MEM。三种算法的使用范围BWA-back...
2019-05-19 18:33:15 20308 1
转载 短序列拼接软件velvet简介
简介Velvet是处理从头测序(de novo)基因组组装及短读长序列比对的一个算法包。 这是使用德布鲁因图通过消调试误和化简重复区域而来进行基因组序列组装。Geneious、MacVector、BioNumerics等商业软件包的内部也实现了Velvet。目前用于新一代的测序的主要仪器有:Illumina/Solexa的Genome Analyzer ABI的Solid Ro...
2019-05-19 17:27:44 2960
转载 二代测序技术相匹配的de novo组装工具
.目前,Velvet,ABySS,SOAPdenovo,VCAKE,SPAdes等[4-6]多种与二代测序技术相匹配的de novo组装工具应运而生,而如何在众多组装工具中,根据序列属性和具体要求来选择与分析组装工具的实用性,对组装最佳结果及后续信息分析尤为重要....
2019-05-19 17:21:37 960
转载 厦门大学 数据库实验室(林子雨)
http://dblab.xmu.edu.cn/blog/category/big-data/厦门大学 数据库实验室(林子雨)
2019-05-17 18:25:13 5452
原创 DNA测序技术
参考文献:[1]石铁流.新技术能使DNA测序的成本降低多少?[J].科学通报,2017,62(19):2042-2046.[2]https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost...
2019-05-16 18:15:16 879
转载 基因组学 实验
基因组学 实验登录服务器Linux机器上登录ssh -l public 172.28.215.241Windows机器上登录用putty客户端登录服务器后请建立自己的目录,以学号+姓名拼音命名,实验数据和结果都放入这个目录设置环境变量:module add bioinfoLinux学习资料Linux command line生物信息学非常有用的一行代码集成Bioinfor...
2019-05-16 11:58:16 655
原创 实验一 基因组组装
实验一 基因组组装一、实验目的熟悉基因组从头组装原理及步骤 掌握velvet, minia, SPAdes等短序列拼装软件使用 熟悉用quast评价组装效果二、基因组组装组装原理与方法两种策略Overlap/layout/consensus De Bruijn k-mer graphs第一种策略主要应用在长reads组装上,如sanger测序数据和第三代测序数据,组装软件...
2019-05-16 11:54:29 4572
转载 DNA测序技术的发展史之——第二代测序技术
DNA测序技术的发展史之——第二代测序技术(1)2016-11-30 11:55:55|分类:生物技术[转载] 经过几十年的改进,第一代测序仪不仅在读长上有较大的突破,准确率高达99.999%,而且测定成本也大幅下降,达到每千碱基序列为0.5美元。但是,不管怎么改进,由于对电泳分离技术的依赖,第一代测序技术在速度和成本方面都已达到极限。在这种情况下,第二代...
2019-05-15 21:22:21 14679 1
转载 DNA测序技术的发展史之——第一代测序技术
DNA测序技术的发展史之——第一代测序技术2016-11-19 15:55:42|分类:默认分类[转载] 1953年,沃森和克里克发现了DNA的双螺旋结构,随后,分子生物学研究发展迅速。20世纪70年代,DNA测序技术发明。2001年,首个人类基因组图谱绘制完成。图1:沃森和克里克创建的DNA双螺旋结构 在30多年时间,测序技术已取得了相当大的...
2019-05-15 21:17:40 23258
转载 测序技术有4个指标:读长、成本、准确度、通量
测序技术迄今为止已发展了三代,测序技术有4个指标:读长、成本、准确度、通量。成本、准确度这两项指标都很好理解,成本下降使得单个人类基因组的花费已经从2001年的1亿美元下降到了1000美元以下。准确度则是测序结果的准确程度,例如二代测序的solid可以达到99.9%,而唯一投入实用的三代测序pacbio错误率为15%。读长指的是测序反应所能测得序列的长度,如果DNA序列长度高于读长,那么必...
2019-05-15 20:52:52 20155
转载 生物信息学格式解读
随笔分类 - 生物信息学格式解读minimap2的结果处理 该文被密码保护。 posted @2019-02-18 23:01djx571 阅读(15) |评论 (0)编辑 常用数据库ID格式 摘要: 转自:http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID Ensembl stable IDs Ensembl ...
2019-05-14 15:43:52 371
转载 RNA-seq分析htseq-count的使用
RNA-seq分析htseq-count的使用HTSeq作为一款可以处理高通量数据的python包,由Simon Anders, Paul Theodor Pyl, Wolfgang Huber等人携手推出HTSeq — A Python framework to work with high-throughput sequencing data。自发布以来就备受广大分析人员青睐,其提供了许多...
2019-05-14 15:43:32 4957
转载 RNA-Seq基因组比对工具HISAT2
RNA-Seq基因组比对工具HISAT2原文网址:http://blog.biochen.com/archives/337HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2。官网:https://ccb.jhu.edu/software/hisat...
2019-05-14 15:38:12 3092
转载 tophat安装
tophat安装1 依赖软件:bowtie,bowtie2,samtools,boost c++ library2 建立索引文件: bowtie包括bowtie,bowtie-build,bowtie-inspect bowtie2包括bowtie2,bowtie2-build,bowtie2-inspect,默认会找bowtie2 bo...
2019-05-14 15:36:46 2005
原创 序列比对
概念: 如果两个序列享有一个共同的进化上的祖先,则这两个序列是同源的(homologous) 直系同源:若一一个基因原先存在于某个物种,而而该物种分化为了两个物种,两个物种中的相同的基因功能未变化; 旁系同源的序列因基因复制(gene duplication)而被区分开(separated):若生生物体中的某个基因被复制了,功能改变了,那么两个副本序列就是旁系同源的。因此,旁系同...
2019-05-14 15:33:23 1404
原创 Chimera 嵌合体
嵌合体序列由来自两条或者多条模板链的序列组成,示意图如下:在PCR反应中,在延伸阶段,由于不完全延伸,就会导致嵌合体序列的出现,以上图为例,在扩增序列X的过程中,在序列延伸阶段,只产生了部分X序列延伸阶段就结束了,在下一轮的PCR反应中,这部分序列作为序列Y的引物接着延伸,扩增就会形成X和Y的嵌合体序列;在放一张具体一点的示意图,不完全延伸产生的序列作为下一轮PCR反应的产物,进行...
2019-05-14 15:26:01 969
原创 canu软件文献
1)背景组装:短的reads通过overlap来组装成contig局限性:repeat 大于overlap导致ambiguous reconstructions and fragment the assembly两个策略:increasing the effective read length(增加reads长度), and separating nonexact repeats ba...
2019-05-14 15:20:03 461
原创 关于三代基因测序,你所需要知道的都在这儿!
关于三代基因测序,你所需要知道的都在这儿!一、导读:在大部分投资者对“二代测序”(NGS)还没有搞清技术细节的情况下,“三代测序”(3GS)又火了。6月17日,医药板块中基因测序相关标的在“三代测序技术获得重大突破”的新闻影响上出现明显涨幅,我们也接到较多投资者对相关新闻的背景及观点的询问。为此,我们结合各方面资料归纳总结了三代基因测序的发展历史、原理、优劣势,以及国内外布局的公司等(...
2019-05-12 15:59:35 18287
转载 基于第三代测序技术的基因组组装方法及其在烟草中的应用
基于第三代测序技术的基因组组装方法及其在烟草中的应用卢鹏,金静静,李泽锋,曹培健,范楷,许亚龙 摘要:第三代测序技术凭借着片段读长更长的优势在基因组研究中得到广泛应用。为此,回顾了测序技术的发展,总结了三代测序技术的优缺点,重点对第三代测序技术的基因组组装方法,包括数据预处理、序列组装、组装之后的序列修补和序列的染色体定位方法进行了追踪和统计,同时介绍了测序技术和基因组组...
2019-05-11 16:04:55 3335
原创 基因组组装(Genome Assembly)
基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列片段(即read),并根据reads 之间的重叠区域对片段进行拼接,先拼接成较长的连续序列(contig),再将contigs 拼接成更长的允许包含空白序列(gap)的scaffolds,通过消除scaffolds 的错误和gaps,将这些scaffolds 定位到染色体上,从而得到高质量的全基因组序列(图1)...
2019-05-11 15:56:09 24643
转载 PacBio三代测序专业术语解读
PacBio三代测序专业术语解读测序百家•2017年3月28日 pm3:57•生命科学•阅读 844以下是Pacbio官方的Pacific Biosciences Terminology英文版的中文翻译,仅供参考,如有问题请纠正。1. 基本技术circular consensus sequencing (CCS) read:环形一致性序列,这种一致性序列通过对来自单个...
2019-05-08 16:38:12 22021
转载 第二代测序技术定义
现在的二代测序建库流程包括9步:RNA提取,反转录,打断,末端修复,加A,加接头,PCR,纯化,质控。其中每一步都要消耗试剂和酶,建库的费用至少要100美元。其实酶什么的都是用大肠杆菌表达生产的,成本只有售价的1/10 到1/100。如果规模大,成本还能降。如果能用机器人在384 空板上做反应, 人工成本也能降下来。一句话,如果规模足够大, 建库成本可以削很多。贺建奎回复董明...
2019-05-08 15:53:04 3060
转载 第三代测序技术定义
第三代测序技术定义关于第三代测序仪,或者说“下下代测序仪”(Next-Next-generation sequencing)的定义还没有一个全面的共识。因为技术的发展和进步是如此之快,以至于新出现的技术不容易按照“代”来划分。在这里,我综合了国内外测序领域的一些观点,尝试着为第三代测序来做一个定义。第三代测序技术最直接的定义为:单分子测序技术。按照这个定义,Helicos Biosci...
2019-05-08 15:43:42 2252
转载 Compatible Software
Compatible Softwaretkerelska edited this pageon 22 Mar·84 revisionsThe following software packages are known to be compatible with PacBio® data, in addition to PacBio's own SMRT® Analysis suite...
2019-05-08 15:39:54 315
原创 GC rich的区域不易测序的原因
GC rich的区域不易测序的原因,主要发生于以下两个阶段:1. PCR 阶段由于GC rich的区域,其氢键数较多,稳定性较强,因此在PCR时,GC rich的区域较不易分开,因此不容易被扩增。此外,即便GC rich的区域在PCR时被分开了,单股的GC rich区域亦容易因为氢键,而自行黏合形成二级结构,亦不易被扩增。若采用PCR free的样本备制方式,则可能改善此PCR所造...
2019-05-08 15:37:14 1261 1
原创 PacBio相关知识
Pacific Bioscience公司简称PacBio读长可达2-3万个碱基,平均长度8千个。Pacbio测序也是边合成边测序。DNA polymor固定在玻璃底板上:首先在聚合酶上标上生物素,在玻璃底板上标上链酶亲和素。利用生物素和链合亲霉素的亲和力结合在一起。加入带四色荧光的dNTP引物,酶会长时间的抓住这个dNTP,激发光从底部照射进来,能在较长时间内发出荧光。一个循环完成...
2019-05-08 15:33:55 1243
转载 RNA-seq最新利器——全长转录组测序
RNA-seq最新利器——全长转录组测序1.三代测序技术PacBioSMRT Sequencing2005年以来,转录组测序和研究的主流是基于NGS,即所谓的二代测序技术,虽然二代测序技术极大地提高了测序通量,且能够发现novel的转录本,但是由于其先天的缺陷,测序读长只能达到几百个碱基(MiSeq可以达到PE300),在转录组结构分析方面,往往效果不尽理想,譬如检测新转录本、...
2019-05-01 16:40:57 2007 1
转载 三代技术的优缺点
三代技术的优缺点都很明显。优点:读长比较长,对拼接类的应用有明显优势;缺点:通量低,测序成本贵; 测序错误率高; 当然,如果 pacbio能持续优化它的缺点,这个技术的应用面肯定会不断拓宽。例如,他们最新版本的测序仪在测序通量和成本上都有明显的进步。我还是比较看好这个技术的。这个技术是否选择使用,还是看研究目的:1. 对于 de novo拼接为目的的研究, 例如:全基因组d...
2019-05-01 16:31:39 7070
OSI七层模型和TCP/IP五层模型
2023-08-19
斐波那契数列第n项是Fn
2023-08-04
Java虚拟机 JVM
2023-08-04
软件定义物联网的QoS建模及其动态路由研究
2023-08-04
单体型基因组组装算法的研究?
2023-08-01
PacBio长read纠错算法的研究
2023-08-01
程序编译的过程有哪些步骤?
2023-07-25
为什么 CPU 访问寄存器的速度比访问内存的速度快
2023-07-25
大数据大数据4V特征?
2023-07-17
大数据big Data何为大?
2023-07-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人