![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息软件
基因学苑
这个作者很懒,什么都没留下…
展开
-
生物信息百Jia软件(六):prodigal
编者按欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘!前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩...原创 2019-08-04 09:46:59 · 1947 阅读 · 0 评论 -
如何下载生物数据(一):生物数据检索
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724编者按:我经常打比方说,生物数据挖掘探索这个过程很像是做菜,同样的食材,不同的厨师会做出不同的东西。但不管怎么样,巧妇也难为无米之炊,首先必须有食材(生物数据)。其实,一个完整的生物信息分析,约80%-90%的时间和工作量都是在做前期准备上,所以,正确下载合适的数据是非常重要的功能,那么从本次开始,我们将通过一系列...原创 2019-08-20 11:29:24 · 1299 阅读 · 0 评论 -
生物信息百Jia软件(21):hisat2
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724编者按现在的软件更新实在太快了,光是转录组用来比对的软件就有很多,bowtie,tophat,star,现在又有hisat以及hisat2,这款软件居然不叫tophat3。又得重新学习,好在万变不离其宗,短序列比对如何变化,都离不开基本的规律,因此,学习原理还是很重要的。一、功能分类:转录组短序列比对二、...原创 2019-08-11 22:27:17 · 1408 阅读 · 0 评论 -
生物信息百Jia软件(22):featureCounts
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724编者按虽然短序列比对工具subread的使用没有bwa和hisat2流行,但是软件包中的featureCounts工具却使用比较广泛。尤其是在利用R语言进行RNAseq分析时,featureCounts几乎成为必须使用的工具。当然说的是R语言版本的featureCounts。一、功能分类:reads计数二、...原创 2019-08-11 22:29:01 · 5019 阅读 · 0 评论 -
生物信息百Jia软件(23):SOAPdenovo
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724编者按SOAPdenobo是soap系列软件中最好用的一款。已经完成非常多的基因组的拼接了,我曾经用过模拟数据,比较SOAPdenovo和velvet以及spades等几款软件的拼接效果,SOAPdenovo无论是完整性还是准确性方面效果否非常好。一、功能分类:序列拼接二、软件官网:http://sour...原创 2019-08-11 22:30:31 · 1110 阅读 · 0 评论 -
生物信息百Jia软件(24):trf
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724编者按trf可以用于串联重复序列的查找,因为这是基因组上的显著特征,因此查找起来并不难,这个串联重复序列也就是所谓的拷贝数变异CNV。那么为何不能用trf来找CNV呢,其实是完全可以的,现在没法这么用,是因为无法得到全基因组序列。一、功能分类:串联重复序列预测二、软件官网:http://tandem.bu...原创 2019-08-11 22:32:39 · 1040 阅读 · 0 评论 -
生物信息百jia软件(25):quast
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724去年这时候制定了一个计划,写100篇生物软件的教程推文,取名字“生物信息百jia软件”,本来以为很快就可以完成,结果没想到由于各种事情,这项计划给搁浅了,只完成了四分之一,半途而废不是我性格,所以,接下来我们继续。当你熟悉Linux操作,熟悉测序原理之后,这部分内容使用起来将异常容易。应用场景1、得到不同软件拼...原创 2019-08-11 22:35:01 · 1246 阅读 · 0 评论 -
生物信息百jia软件(27):三代数据拼接falcon
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724随着三代测序的普及,现在越来越多的序列拼接依赖三代测序长读长的特点,最开始的时候三代数据只作为二代测序的辅助材料,用来连接更长的scaffold与补洞,而现在,三代测序可以单独就行拼接,或者用二代测序来纠错,可以说,技术的发展,方法上已经发生了根本的变化。现在三代数据已经可以进行单独的拼接了,所以,赶快学习三代测序...原创 2019-08-11 22:38:33 · 897 阅读 · 0 评论 -
生物信息百Jia软件(28):canu
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724上一次介绍了三代拼接工具falcon,但是falcon这款无论是从安装还是使用都比较麻烦,对于新手是一个很大的考验,这里次我们介绍一款更好用的三代拼接工具canu。canu这款软件来自于经典的 Celera Assembler。celera最早用于人类全基因组计划,后来随着二代测序数据的普及,这种基于overlap...原创 2019-08-11 22:39:56 · 685 阅读 · 0 评论 -
如何下载生物数据(二):利用ftp下载参考基因组
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724前面我们介绍了如何进行生物数据的检索,当得到了数据的下载地址之后,接下来就可以开始下载了,那么下载数据的方式有很多种,最常用的就是使用浏览器进行下载,不过浏览器使用的是http(s)协议,下载速度慢,而且如果突然中断,断点续传也比较麻烦,这次我们介绍更好用的ftp协议下载方式。FTP下载FTP 是File Tr...原创 2019-08-28 08:19:46 · 3423 阅读 · 1 评论 -
如何下载生物数据(三):GATK数据下载
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724当前做人相关的基因组分析,包括全基因组WGS,全外显子WES以及目标区域测序TRS,基本上都采用GATK标准的Best Practise最佳实践指导。人的基因组分析与其他物种稍微有一些不同,处理下载参考序列,还需要下载已有信息,例如各种人类基因组计划累积的变异信息,这些信息可以用于先验的学习集,提高变异检测的准确性...原创 2019-08-28 08:21:56 · 5602 阅读 · 5 评论 -
如何下载生物数据(四):SRA数据下载
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724应用场景:如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要测试一些软件,或者想重复文章的内容,就需要从SRA数据库下载数据。SRA数据库介绍https://www.ncbi.nlm.nih.gov/sra/SRA(Sequence ReadArchive)数据库是NCBI用于存储二代...原创 2019-08-28 08:24:10 · 5628 阅读 · 0 评论 -
生物信息百Jia软件(二十):lumpy
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评基因组结构变异SV的检测一直都是当前基因组研究中非常困难的课题,由于二代测序多长过短,因此无论在优化算法,也很难解决根本性的问题。因此,很多用于SV检测的工具都没有太理想的效果,lumpy也只是在前面软件的基础上进行优化,其实并没有根本性的解决问题,不过算是多了一种新的解决方法了。一、功能分类:SV检...原创 2019-08-08 21:36:14 · 1789 阅读 · 1 评论 -
生物信息百Jia软件(十九):cope
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评cope也是华大团队出品的一款软件,和SOAP系列其他软件类似,功能强大,使用简单,支持多种模式进行具有overlap的pairend reads进行连接,连接的效果非常不错,其实我觉得要比flash,fastq-join这些工具好用的。一、功能分类:Pairend Read连接工具二、软件官网:...原创 2019-08-08 21:34:48 · 572 阅读 · 0 评论 -
生物信息百Jia软件(十八):spades
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评SPAdes序列拼接软件是序列拼接软件中的后起之秀,拼接效果很不错,目前很多拼接软件已经都不在更新了,而spades却持续进行更新。该软件使用非常简单,并且支持多种数据格式,还支持混合拼接,使用起来非常方便。对于小基因组拼接有很好的拼接效果,不过经过更新,目前对于大基因组,甚至多倍体的基因组也有不错的效果...原创 2019-08-08 21:33:39 · 2233 阅读 · 1 评论 -
生物信息百Jia软件(七):glimmer
编者按欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘!前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩...原创 2019-08-04 09:49:07 · 868 阅读 · 1 评论 -
生物信息百Jia软件(八):blat
点评blat也是学习生物信息需要掌握的一款工具。blat与blast其实是不同的,虽然都是局部比对工具,但是blat实现了“多对一”的比对,也就是能将不同的外显子定位到同一个基因上。我喜欢blat可以输出多种比对格式结果的模式,默认是psl,但其实可以输出blast同样格式的结果,还有比较容易阅读的axt格式结果。需要注意的是,blat的其实比对坐标与blast不同。一、功能分类:局部比对...原创 2019-08-04 09:50:51 · 1351 阅读 · 0 评论 -
生物信息百Jia软件(九):Mummer
欢迎订阅微信公众号:基因学苑,更多精彩内容等你发掘!基因学苑QQ群:32798724mummer具有一定的历史了,应该最早发表于1999年,是最早的全局比对软件,因为之前序列都比较短,以局部比对软件为主。mummer的出现,让我们第一次能够比较到不同物种两个完整基因组之间的差别。mummer里面的小工具比较多,有很多非常好用的小工具,例如dnadiff,但这同时也增加了学习成本。mummer的...原创 2019-08-05 19:44:56 · 5454 阅读 · 1 评论 -
生物信息百Jia软件(十):seqtk
欢迎订阅微信公众号:基因学苑,更多精彩内容等你发掘!基因学苑QQ群:32798724seqtk同样来自于生物信息大神李恒之手,被称为序列处理的瑞士军刀,可以方便处理日常序列分析中的小问题,例如将fq转换为fa,格式化序列,截取序列等这些问题并不难,但是可能需要编程完成,而seqtk已经集合了这些功能,一条命令就可以轻松完成,建议好好学习seqtk工具的使用,可以大大提高序列分析的效率。一、功...原创 2019-08-05 19:45:58 · 1371 阅读 · 0 评论 -
生物信息百Jia软件(十一):svsim
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724模拟数据其实是非常重要的,通过模拟数据可以方便评估一款软件的准确性与敏感性。SV检测一直是基因组分析中最难的一个问题,一方面是因为目前测序读长过短,另一方面是因为SV类型多变,包括插入,缺失,易位,倒位,倍增等多种类型,通过svsim可以分别模拟每一种sv类型,然后可以利用wgsim对其进行模拟测序,之后可以用sv...原创 2019-08-05 19:54:41 · 396 阅读 · 0 评论 -
生物信息百Jia软件(十二):trimmomatic
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评数据处理的工具其实有很多,前面我们也介绍过了fastp。因为处理的原则都差不多,最重要的是了解数据处理的原理,为何要过滤低质量,N碱基,adapter,duplication等。我自己是不喜欢用trimmomatic的,因为参数比较复杂,其实,以前我的同事们好多人都自己写个工具,只不过大家没觉得数据处理还...原创 2019-08-08 21:22:36 · 1154 阅读 · 0 评论 -
生物信息百Jia软件(十三):clustalw
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评clustalW是一款经典的多序列比对工具,在高通量测序开始之前已经被广泛使用了,具有非常高的引用率。可以进行多个同源基因的多序列比对,比对完成之后可以用于构建分子数。在高通量测序时代,ClustalW依然具有重要的作用。是一款需要掌握的生物信息工具。一、功能分类:多序列比对二、软件官网:http...原创 2019-08-08 21:24:16 · 2245 阅读 · 0 评论 -
生物信息百Jia软件(十四):velvet
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评velvet是最早的用于二代测序的序列拼接工具,拼接效果还可以,不过我觉得不如SOAPdenovo效果好。其实也不只是觉得,也测试过很多数据,SOAPdenovo可以构建更多的scaffold序列,也就是序列的完整性更好,velvet局部准确性更高,其实也很难具体说谁更好,经常是多个工具都试一遍,然后看结...原创 2019-08-08 21:26:40 · 605 阅读 · 0 评论 -
生物信息百Jia软件(十五):rnammer
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评rnammer是用来预测原核与真核生物核糖体序列的程序,使用起来非常简单,直接给基因组序列即可。因为核糖体具有一定的结构特征,因此预测起来非常简单,而且准确性非常高,所以,在核糖体预测方面,目前并没有太多其他的工具可选,rnammer是必须掌握的一个生物信息软件。一、功能分类:核糖体RNA预测二、软...原创 2019-08-08 21:28:29 · 1267 阅读 · 0 评论 -
生物信息百Jia软件(十六):tRNAscan
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724通哥点评与rnammer工具类似,tRNAscan专门用于转运RNA的预测,由于转运RNA具有固定模式,而且非常显著的倒三叶草模式,因此预测并不难,准确性也比较高,所以,在这个分析方面基本上没有对手,也没有太多类似的工具,对于tRNA预测,掌握这一款工具就差不过够了。一、功能分类:转运RNA预测二、软件官网...原创 2019-08-08 21:30:20 · 513 阅读 · 0 评论 -
生物信息百Jia软件(十七):flash
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724编者按前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优...原创 2019-08-08 21:32:00 · 1002 阅读 · 0 评论 -
如何解决生物软件报错问题
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!基因学苑Q群:32798724经常有人截一张或几张生物软件报错的图给我,咨询一下错误原因,一般面对这种情况,我的内心都是奔溃的,尤其是我在手机上看的时候,因为屏幕太小,看不清。即使看清了,我也不知道什么原因。因为,我还做不到图像识别,看到什么软件报错,都能立刻给出原因,但是可以给出一些建议啊……处理软件错误分为两步:第一,诊断原因;第二,...原创 2019-08-28 08:25:46 · 659 阅读 · 0 评论