生信常用软件汇总

blast

基本介绍

BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。

  • blastp是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。
  • blastx是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。
  • blastn是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。在这里插入图片描述

参数介绍

博客来源https://www.jianshu.com/p/de28be1a3bea

  • -db : 数据库在本地的位置,或者是NCBI上数据库的类型

  • -query: 检索文件

  • -query_loc : 指定检索的位置

  • -strand: 搜索正义链还是反义链,还是都要

  • out : 输出文件

  • -remote: 可以用NCBI的远程数据库, 一般与 -db nr

  • -evalue 科学计数法,比如说1e3,定义期望值阈值。E值表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。 与S值有关,S值表示两序列的同源性,分值越高表明它们之间相似的程度越大 E值总结:
    1.E值适合于有一定长度,而且复杂度不能太低的序列。2. 当E值小于10-5时,表明两序列有较高的同源性,而不是因为计算错误。3. 当E值小于10-6时,表时两序列的同源性非常高,几乎没有必要再做确认。

  • -gapopen,打开gap的代价;

  • -gapextend, gap延伸的代价;

  • -penalty:核酸错配的惩罚;

  • -reward, 核酸正确匹配的奖励;

  • 结果过滤:-perc_identity, 根据相似度

busco

基本介绍

参考这篇博客吧,巨详细,贼好用
https://www.jianshu.com/p/5041460f7a5d

基本介绍

原文链接https://blog.csdn.net/u010608296/article/details/101713130

wgsim是一块用于高通量数据模拟的软件,whole genome simulation。这款软件可以模拟出illumina测序数据,并且可以自由调整测序reads的读长,插入片段大小以及错误率等,使用起来比较方便。模拟数据主要用于软件的测试与评估。例如对序列拼接软件的评估。因为模拟数据是根据已有的参考序列来的,我们可以将模拟出来的数据进行拼接,再将拼接的结果与原序列进行比对。这样就能每次调整单因素变量,例如比较不同reads读长,不同插入片段大小或者不同错误率条件下,对序列拼接的影响。
也可以为参考序列模拟变异位点,例如点突变、片段获得缺失等,然后模拟数据,评估软件是否可以检测出这些变异位点。

  • -e 是错误率,默认是0.02
  • -d reads两头的距离,也就是插入片段长度,默认250bp,注意插入片段本身是包含reads长度的,而不是reads之间的距离
  • -s 是-d插入片段的偏差,默认是20,也就是-d的值加减20,我们知道插入片段长度并不是固定的,而是一个范围
  • -N 是测序的层数,控制输出数据量
  • -1 是reads1长度,默认70bp
  • -2 是reads2长度,默认70bp
  • -r 突变率
  • -R -X 都是调整indels的
  • -h 是单倍体模式
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
NCBI是美国国家生物技术信息中心的缩写,也是全球最大的生物技术数据之一。在NCBI中,我们可以通过不同的工具和数据来进行差异表达分析。 差异表达分析是研究不同样本之间基因或基因表达水平差异的一种方法。在NCBI中,可以利用大量的生物信息学工具和数据来进行这种分析。 首先,我们可以通过NCBI的基因数据(如Gene)来查找感兴趣的基因,并获取其序列及其他相关信息。然后,我们可以使用NCBI的BLAST工具来比较不同样本中这些基因的序列相似性,以确定是否存在差异表达。 另外,NCBI还提供了一些专门用于差异表达分析的工具,如GEOSeries和GEO2R。GEOSeries是一个基因表达数据的存储,可以用于查找和下载公开共享的差异表达数据。GEO2R则是一个在线的差异表达分析工具,它可以帮助我们对这些数据进行统计分析,并找出差异表达的基因。 此外,NCBI还提供了许多其他的工具和数据,如SRA和BioProject,它们可以帮助我们获取和管理差异表达数据。SRA是一个序列读取存档数据,可以存储和检索高通量测序数据,而BioProject则是一个研究项目的信息管理,可以帮助我们对相关研究进行组织和整合。 总之,NCBI提供了丰富的生物信息学工具和数据,可以帮助我们进行差异表达分析。通过这些工具和数据,我们可以更好地理解基因的表达调控机制,以及不同样本之间的差异。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值