生信分析-bioinfo
文章平均质量分 90
生物信息学分析相关内容,主要包括16s,its高通量扩增子序列分析,宏基因组学分析等
小果运维
个人长期从事服务器软硬件运维,熟悉windows及linux常见服务设置和bug调试,熟悉大数据管理,熟悉基于nodejs,react和express的全栈开发;长期从事生物信息学尤其是扩增子和宏基因组学方面的生物信息学分析,欢迎有意合作者骚扰。
展开
-
MetaHipMer2 - MHM2超算系统宏基因组短读长序列组装神器的介绍和使用
MetaHipMer (MHM) 是一种从头开始的宏基因组短读组装器。这是版本 2 (MHM2),完全用 UPC++、CUDA 和 HIP 编写,可以在单服务器和多节点超级计算机上高效运行,可以扩展以共同组装 terabase 大小的元基因组。the有关构建、安装和运行 MHM2 的信息可以在用户指南中找到。原创 2024-01-19 09:14:00 · 859 阅读 · 0 评论 -
开源的RNA-Seq分析软件Trinity的详细介绍和使用方法
Trinity是一种开源的RNA-Seq分析软件,用于转录组的de novo组装。转录组de novo组装是通过将RNA-Seq数据中的短序列片段(reads)重新组装成完整的转录本(transcript)的过程。Trinity的主要功能和作用如下:转录本组装:Trinity可以将RNA-Seq数据中的reads重新组装成完整的转录本。它通过比对和组装过程,将reads组装成相应的转录本,并生成一个转录本集合。这些转录本可以用于进一步的分析和注释。原创 2024-01-10 07:00:00 · 1890 阅读 · 0 评论 -
真核微生物基因组质量评估工具EukCC的安装和详细使用方法
随后,它会识别那些至少达到50%完整度但尚未超过100-improve_percent的中等质量bins。接下来,它会找出那些通过至少100对端读配对与这些中等质量bins相连接的bins。若经过合并后bin的质量评分有所提高,则该bin将会被合并。还有个副产品,diamond的数据库,不过好像看不出是diamond的哪个版本生成的,用的时候不好用的话就用下载的数据库再生成一遍吧。如果不知道数据库位置,或者软件找不到位置,那就简单吧,设置DB目录。下载数据库注意版本,一般选版本2吧,原创 2024-01-07 06:30:00 · 790 阅读 · 0 评论 -
从细菌基因组中提取噬菌体变异序列工具PhaseFinder的介绍、安装和使用方法
To install PhaseFinder,安装。## Prerequisites,安装依赖。## 概览,不翻译了,大家自己看吧。教程Tutorial。原创 2024-01-06 05:00:00 · 947 阅读 · 0 评论 -
真核微生物基因序列鉴定工具EukRep工具的安装和详细使用方法
调整识别严格度 通过-m参数可以调整识别真核连续体的严格度。以下展示了严格、平衡和宽松模式下的假阳性率(FPR)和假阴性率(FNR)。然而,由于EukRep存在假阳性率,即使在这种情况下,您仍可能得到输出结果。EukRep是一种用于鉴定并分析环境中的真核微生物的工具。它基于16S rRNA基因序列,可以帮助研究人员确定和分类环境样品中存在的真核微生物群落。注:以上数据是通过将EukRep应用于来自模拟新门类基因组的20kb和5kb片段化支架上获得的。EukRep 从宏基因组数据集中分类真核和原核序列。原创 2024-01-06 06:30:00 · 1060 阅读 · 0 评论 -
噬菌体序列分析工具PhaVa的使用和使用方法
github:挺简单的,这里就不翻译了,大家看着直接用吧。原创 2024-01-06 06:30:00 · 844 阅读 · 0 评论 -
宏基因组序列分析工具EukRep
获取真核生物bins EukRep设计用于作为更大规模分析流程的一部分。调整筛选严格度 可以通过-m参数调整识别真核contig的严格度。以下是严格、平衡和宽松模式下的假阳性率(FPR)和假阴性率(FNR)。默认设置为平衡模式。在0.6.5版本之前,默认设置为宽松模式。此处未给出具体的数据内容,但可根据上述描述理解,在不同长度的支架上应用EukRep,可以得到不同筛选严格度下对应的假阳性和假阴性结果。原创 2024-01-06 06:15:00 · 1005 阅读 · 0 评论 -
快速、准确地检测和分类病毒序列分析工具 ViralCC的介绍和详细使用方法, 附带应用脚本
viralcc支持FASTA和FASTQ格式的输入文件,你可以将你的病毒序列文件准备好。viralcc会自动进行病毒序列的分类和注释,并将结果保存到指定的输出文件中。viralcc是一个基因组病毒分析工具,可以用于快速、准确地检测和分类病毒序列。从GitHub上下载viralcc的代码。以上就是viralcc的介绍、安装和使用方法。首先,确保你已经安装了Python 3.6或更高版本。运行viralcc进行病毒分析。安装viralcc。是你想要保存结果的文件路径。是你的病毒序列文件的路径,原创 2024-01-05 07:00:00 · 1519 阅读 · 0 评论 -
基于综合特征的细菌噬菌体宿主预测工具iPHoP (Integrated Phage HOst Prediction)的介绍以及使用方法详细流程
iPHoP(Integrated Phage HOst Prediction)是一种基于综合特征的细菌噬菌体宿主预测方法。它是通过整合基因组序列、蛋白质序列和宿主基因组信息来预测细菌噬菌体的宿主范围。iPHoP的预测过程分为三个步骤:特征提取、特征选择和宿主预测。在特征提取阶段,iPHoP会从噬菌体基因组和宿主基因组中提取一系列特征,包括基因组特征、蛋白质特征和宿主基因组特征。在特征选择阶段,iPHoP使用机器学习算法从提取的特征中选择最具有预测能力的特征。原创 2024-01-05 06:00:00 · 1779 阅读 · 1 评论 -
宏基因组序列无参考基因组装工具idba-ud的介绍及详细使用方法
idba-ud工具是一种用于组装无参考基因组的工具,它可以将高通量测序数据转化为基因组序列。它是idba工具的升级版本,专门用于组装多样性的无参考基因组。idba-ud的主要作用是通过组装测序数据,生成无参考基因组的序列。它能够处理短读长和长读长两种类型的测序数据,并且能够在组装过程中处理高度异质性的数据。idba-ud还具有高度并行化的特点,可以充分利用计算资源进行快速的基因组组装。idba-ud的背景产生源于生物学领域对于无参考基因组组装的需求。原创 2024-01-03 08:07:46 · 848 阅读 · 0 评论 -
三代测序数据或长contigs的纠错和基因组组装工具的安装方法和详细使用方法
Canu是一种用于长读长contigs的纠错和基因组组装工具。它最初是为了处理PacBio等第三代测序技术产生的长读长DNA测序数据而设计的。更近期,Canu也开始支持Oxford Nanopore等其他长读长测序技术。Canu的目标是通过利用长读长测序数据,提供高质量的基因组组装结果。它的设计思路是以自我校正(self-correction)为基础的组装方法。原创 2024-01-02 09:57:33 · 1227 阅读 · 0 评论 -
宏基因组学中基于Kraken2、Blast、ViPhOG和VirSorter等工具分析病毒组的详细流程,包括数据预处理、病毒序列检测、分类和功能注释等步骤
宏基因组学中分析病毒组的详细流程,包括数据预处理、病毒序列检测、分类和功能注释等步骤。示例代码使用了常用的生物信息学工具,如Kraken2、Blast、ViPhOG和VirSorter等。原创 2023-12-21 12:14:56 · 1386 阅读 · 1 评论 -
基因表达差异分析R工具包DESeq2的详细使用方法和使用案例
DESeq2是一种常用的差异表达基因分析工具,可用于RNA-seq数据的差异表达分析。下面是DESeq2的详细使用步骤和全部脚本示例。原创 2023-12-20 09:51:15 · 4279 阅读 · 0 评论 -
生信分析代谢通路可视化分析R工具包ggkegg的使用案例
在此示例中,我们突出显示了由其 LFC 着色的有效边 (KO),点大小对应于网络中的度数,并显示了有效 KO 名称的边缘标签。首先,我们加载必要的数据,这些数据可以从调查 KO 的数据集中获得,这些数据是从管道中获得的,例如 .在这里,我们选择了 ,节点根据降维图中的颜色着色,两个聚类中的标记都按指定的颜色 () 着色。下面的示例将类似的反射应用于原始 KEGG 图谱,并突出显示在两种条件下都显示出统计学显着变化的基因,使用黄色外光,由 clusterProfiler 生成的组成,富集结果为。原创 2023-12-20 09:06:17 · 1430 阅读 · 1 评论 -
生物信息学R分析工具包ggkegg的详细使用方法
ggkegg 返回一个具有不同图层的 ggplot2 图表,可以使用 ggplot2 提供的其他函数对其进行定制和修改。ggkegg 是一个用于生物信息学研究的工具,可以用于分析和解释基因组学数据,并将其与已知的KEGG数据库进行比较。ggkegg 支持各种不同的基因组学数据格式,例如基因表达数据、基因注释文件等。安装和加载 ggkegg 包:首先,您需要确保已在 R 环境中安装了 ggkegg 包。函数进行进一步的定制和修改,例如添加标题、修改颜色和背景等。使用 ggkegg 函数: 使用。原创 2023-12-20 08:37:15 · 1485 阅读 · 0 评论 -
宏基因组学Metagenome-磷循环Pcycle功能基因分析-从分析过程到代码及结果演示-超详细保姆级流程
磷循环数据库 (PCyCDB),包含 138 个基因家族和 10 个代谢过程。将同源基因添加到数据库中,以降低假阳性率。通过识别已知的模拟基因数据集和模拟细菌群落,对序列相似性搜索工具(如BLAST、USEARCH、DIAMOND)生成的比对结果进行过滤的标准(即身份、命中长度)进行了细化,以获得最佳准确性并进一步减少假阳性和假阴性。在70%的同一性和25个氨基酸的截留点下,准确率、PPV、灵敏度、特异性和NPV分别为99.76%、95.70%、99.94%、99.74%和99.99%。原创 2023-12-17 13:30:44 · 2760 阅读 · 6 评论 -
基于BWA,Bowtie2,Salmon和SAMtools、checkm等工具计算宏基因组学序列分析中Contigs与Genes在样品中的丰度,多种计算方式和脚本对比(20231217更新)
计算contigs的丰度一般使用assembly的结果,计算基因风度时一般用prodigal的结果,prodigal结果中建议同时输出蛋白序列和核酸序列文件,基因注释是一般使用diamond需要使用蛋白序列,而这里计算丰度需要与原始核酸序列进行比对,所以这里要用核酸序列,prodigal输出的核酸序列和蛋白序列id一样,所以只需要最后以序列id进行mapping就可以了。原创 2023-12-16 06:00:00 · 2406 阅读 · 5 评论 -
生物信息学分析领域领先的特制语言环境NGLess(Next Generation Less)介绍、安装配置和详细使用方法
NGLess可以作为一个通用的工具平台,支持用户自定义分析流程,集成不同的分析工具和算法,根据研究需要进行灵活的分析和处理。准备数据:获取并准备用于分析的原始测序数据。质量控制和过滤:对原始数据进行质量控制、去除低质量序列和去除宿主DNA等。人类肠道宏基因组分类:对数据进行分类,识别宿主肠道微生物。功能注释:对宏基因组数据进行功能注释,识别和分析肠道微生物的功能特征。原创 2023-12-15 18:13:25 · 877 阅读 · 0 评论 -
宏基因组学及宏转录组学分析工具MOCAT2(Meta‘omic Analysis Toolkit 2)安装配置及常用使用方法
尽管这个工具已经暂停后续开发,但其工具功能还是挺好的,大家可以参考一下,尤其对于喜欢自定义开发流程的可以参考是流程。MOCAT 2(Meta'omic Analysis Toolkit 2)是一个用于宏基因组和宏转录组数据分析的工具集,旨在处理和分析来自各种环境样品(如土壤、水体、肠道等)的宏基因组学和宏转录组学数据。它提供了一系列功能模块,涵盖了数据预处理、序列比对、装配、功能注释和分析等方面。官网:MOCAT2github:GitHub - mocat2/mocat2: Latest MOCAT2 ve原创 2023-12-15 15:40:51 · 1225 阅读 · 0 评论 -
基于conda环境下的宏基因组学分析利器MetaWRAP 1.3.2 安装和使用,序列分析基本流程自动分析脚本
先看图再看帮助信息Modules:MetaWRAP提供了一系列工具模块,可用于处理从环境样品中获得的大规模DNA序列数据。Quality Control(质量控制)功能:这个步骤用于检查和修剪原始序列数据,去除低质量序列、接头序列或污染序列,确保后续分析的数据质量。MetaWRAP模块。Assembly(组装)功能:将碎片序列组装成较长的连续序列(contigs),有助于获得更完整的微生物基因组信息。MetaWRAP模块,使用组装器如MEGAHIT、metaSPAdes等。原创 2023-12-15 09:38:43 · 2142 阅读 · 0 评论 -
宏基因组学中如何计算分箱结果bins(基因组)的丰度?
MetaWRAp(Metagenomic Workflow for Assembly, binning, and annotation)是一个用于处理宏基因组学数据的工具,包括元组装、分箱(binning)、基因组注释等功能。:首先确保已经安装了 MetaWRAp 工具。你可以通过官方的 GitHub 页面(:准备你的宏基因组学数据,包括原始测序数据(fastq 或者 fasta 格式)以及进行元组装得到的 contigs 或 scaffolds。原创 2023-12-14 15:59:32 · 2175 阅读 · 2 评论 -
基于qiime2 扩增子分析结果进行LEfse差异物种进化关系和出图
LEfSe(LDA Effect Size)分析是一种将非参数的Kruskal-Wallis以及Wilcoxon秩和检验,与线性判别分析(Linear discriminant analysis,LDA)效应量(Effect size)相结合的分析手段。与MetagenomeSeq分析类似,LEfSe分析也是一种差异分析方法;但LEfSe分析可以直接对门/纲/目/科/属/种的各级分类水平同时进行统计检验和差异分析。原创 2023-12-11 15:22:56 · 741 阅读 · 0 评论 -
基于conda环境使用mamba/conda安装配置QIIME 2 2023.9 Amplicon扩增子分析环境,q2cli主要功能模块介绍及使用
q2cliq2-dada2q2-deblurq2-demuxq2-emperorq2-taxaq2-typesq2-vsearchq2-diversity-lib是QIIME 2的一个插件,用于计算多样性指数和样本间的差异。它基于多种生物多样性指标来评估微生物群落的多样性,并允许用户进行统计比较和可视化。原创 2023-12-11 14:10:35 · 1913 阅读 · 0 评论 -
WoM2023-Shotgun Metagenomic宏基因组 Data Аnalysis with bioBakery,on MetaPhlAn, StrainPhlAn, and cMD
MetaPhlAn4安装方法:202310-宏基组学物种分析工具-MetaPhlAn4安装和使用方法-Anaconda3- centos9 stream-CSDN博客文章浏览阅读1.1k次。MetaPhlAn 4是一种基于DNA序列的微生物组分析工具,它能够从宏基因组测序数据中识别和分离微生物的组成。原创 2023-12-08 10:33:22 · 1474 阅读 · 0 评论 -
Q2_ITSxpress-Qiime2 ITS 分析插件安装及使用
这个插件就是作者将这个软件做成了qiime2的插件,因此,大家可以先了解一下ITSEXPRESS 和 ITSx。akutils这个仓库比较老了,但还有很多东西是可以借鉴一下的。下面这个是新版也好几年了。原创 2023-12-05 09:26:46 · 1351 阅读 · 4 评论 -
EasyMetagenome易宏基因组——简单易用的宏基因组分析流程-来自刘永鑫团队的秘密武器
原仓库地址如下,github有时候无法访问,等一段时间再试就行:YongxinLiu/EasyMetagenome: Easy Metagenome Pipeline (github.com)相关文章,看文章更清晰这个可干啥:EasyAmplicon: An easy‐to‐use, open‐source, reproducible, and community‐based pipeline for amplicon data analysis in microbiome research - Liu -原创 2023-12-03 13:06:39 · 2756 阅读 · 3 评论 -
MMseqs2蛋白质序列快速高效比对工具
无论哪个工具软件,无论你是否熟悉,都推荐你看一下作者原文,这样后面的步骤以及怎么使用头脑里会更清晰。MMseqs是一种快速和有效的蛋白质序列比对工具。原创 2023-12-02 16:41:00 · 2618 阅读 · 0 评论 -
EasyAmplicon (易扩增子)-扩增子高通量序列分析软件流程及脚本-详细使用方法——来自刘永鑫团队的秘籍
先按照大神自己的实验设计描述整理一个全信息的表格,表头设置为一样,这里就不解释字段意思了,会实验设计的基本都了解,样例文件在EasyAmplicon/result下,大家同样整理一个名为metadata_raw.txt的文件放入新的work文件夹。# -a 找不到输入列将终止运行(默认不执行)-c 将整数列转换为factor或具有小数点的数字,-t 偏离提示标签时转换ID列,-w 颜色带,区域宽度等, -D输出目录,-i OTU列名,-l OTU显示名称如种/属/科名,原创 2023-12-01 16:44:01 · 1486 阅读 · 4 评论 -
EasyMicrobiome-易扩增子、易宏基因组等分析流程依赖常用软件、脚本文件和数据库注释文件
这里面的脚本最大的好处就是每个脚本里面都已经将每个参数包括输入输出等都已经注释说明,大家可直接根据参数调整使用。原创 2023-11-30 21:47:14 · 1684 阅读 · 0 评论 -
dbCAN碳水化合物酶基因数据库及run_dbCAN4工具安装配置及使用
dbCAN(碳水化合物酶基因数据库)是一个专门用于在基因组中预测碳水化合物酶基因的在线工具。它基于隐马尔可夫模型(HMM)和BLAST搜索,能够在蛋白质序列中识别和注释不同类型的碳水化合物酶基因,包括纤维素酶、木质素酶、半纤维素酶、淀粉酶、果糖酶等等。dbCAN是一个非常有用的生物信息学工具,对于研究纤维素生物转化、生物能源、生产生物基化学品等领域的研究具有重要意义。Run_dbCAN是一个用于预测生物信息学中的碳水化合物活性酶的工具。它用于分析基因组或转录组数据,以识别编码碳水化合物活性酶的基因。原创 2023-11-30 13:01:22 · 2008 阅读 · 0 评论 -
Virsorter2-病毒组序列分析工具安装及使用20231126
Github访问正常的和英语功底还可以的直接查看github吧,这里主要以自己使用的东西来介绍virsorter2的整个安装和主要使用内容。原创 2023-11-26 21:43:44 · 2142 阅读 · 2 评论 -
DRAM(Distilling and Refining Annotations of Metabolism,提取和精练代谢注释)工具安装和使用
默认使用conda安装吧,也建议使用conda,pip安装其实都差不多,但容易破坏当前环境。所以其实这里还需要安装virsorter软件,virsorter的操作使用后面再补上。基于virsorter的结果进行注释,相当于过滤了。看不懂的百度翻译吧,反正需求内存不小。基因组完整注释和提取。原创 2023-11-23 16:58:19 · 1496 阅读 · 6 评论 -
GTDB-Tk v2: memory friendly classification with the Genome Taxonomy Database, 物种注释和进化树构建工具使用及介绍
这个就是分类了,就是物种注释ani_screenidentifyalign, andclassifyiTOLidentifyaligninferroot, anddecorate###输入输出文件格式:>genome_aAKLAK01011>genome_aKAK大家随时可参考这里查看输入输出文件格式,每类文件都有一个示例gtdbtk.logmsa.fastapfam.tsvtree.log。原创 2023-11-22 17:02:07 · 1901 阅读 · 0 评论 -
hclust2.py做聚类热图-基于MetaPhlAn结果或类似结构数据
MetaPhlAn怎么安装使用看这里: 202310-宏基组学物种分析工具-MetaPhlAn4安装和使用方法-Anaconda3- centos9 stream-CSDN博客MetaPhlAn运行完成后合并物种丰度结果,相同结构的矩阵也可以画聚类热图出图结果下面就是出图结果,其他的自己看吧,原创 2023-11-09 10:48:53 · 596 阅读 · 0 评论 -
基因预测软件prodigal的使用
Prodigal是一款常用的基因预测软件,可以用于预测原核生物基因组中的开放阅读框(ORF),并根据不同的编码调用方式(如起始密码子和终止密码子)对其进行注释。原创 2023-11-05 20:28:05 · 852 阅读 · 0 评论 -
diamond大基因序列快速比对工具使用详解-包含超算集群多节点计算使用方法
Diamond的输出文件包含每个待比对序列的匹配结果,包括匹配的参考序列名、匹配位置、匹配得分等信息。以上就是Diamond的基本使用方法,更详细的说明可以参考官方文档:https://github.com/bbuchfink/diamond/wiki。其中,blastx表示使用蛋白质序列比对算法,-d和-q分别指定参考序列文件和待比对序列文件,-o指定输出文件名。diamond blastx -d [参考序列文件] -q [待比对序列文件] -o [输出文件名]原创 2023-10-30 21:16:53 · 1851 阅读 · 0 评论 -
生物信息学分析-blast序列比对及结果详细说明
Blast是一种基于序列比对的分析工具,可以用于寻找生物序列之间的同源性,它的全称是Basic Local Alignment Search Tool。Blast有多种版本和用途,最常见的是基于Web的Blast和本地安装的Blast程序。Web版Blast可以直接在NCBI网站上使用,而本地安装的Blast程序需要下载和安装在计算机上。Blast的使用流程一般为输入一个查询序列,与数据库中的序列进行比对,输出比对结果。原创 2023-10-30 20:08:07 · 3540 阅读 · 0 评论 -
202310-宏基组学物种分析工具-MetaPhlAn4安装和使用方法-Anaconda3- centos9 stream
MetaPhlAn 4是一种基于DNA序列的微生物组分析工具,它能够从宏基因组测序数据中识别和分离微生物的组成。原创 2023-10-26 23:15:40 · 3848 阅读 · 7 评论 -
使用vsearch进行its扩增子高通量序列分析步骤
VSEARCH是一个开源免费的64位,无内存限制的扩增子数据处理分析软件。(点到为止,其他的建议大家参考原文献和网站)原创 2023-10-08 21:56:46 · 148 阅读 · 1 评论 -
使用vsearch进行16s扩增子高通量序列分析步骤
VSEARCH是一个开源免费的64位,无内存限制的扩增子数据处理分析软件。(点到为止,其他的建议大家参考原文献和网站)最新文献:Edgar RC (2016)bioRxiv。原创 2023-10-08 17:03:46 · 571 阅读 · 1 评论