自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 问答 (1)
  • 收藏
  • 关注

原创 R计算相关性-单表

用R包Hmisc里的rcorr函数计算相关性,并将输出矩阵格式进行转换。这里我用的是单表,行为样本名,列为细菌相对丰度,想计算细菌之间的相关性。rcorr函数计算相关性的方法有两种:Pearson和Spearman,使用示例如下:Usagercorr(x, y, type=c(“pearson”,“spearman”))install.packages('Hmisc')library(Hmisc)data<-read.table("clipboard",header = T,row.nam

2022-01-06 15:41:57 1805

原创 R包tsne降维在微生物中的应用

data为991位结直肠癌病人组织的微生物相对丰度表,行为样本,列为细菌,最后一列为分组,分为癌症的四个阶段install.packages("tsne")library(tsne)data<-read.table("clipboard",header = T,row.names = 1)colors = rainbow(length(unique(data$stage)))names(colors) = unique(data$stage)head(colors)tsne_data&l

2021-12-30 17:14:28 376

原创 普氏分析在生信中的应用

普氏分析(Procrustes Analysis)在微生物群落研究的过程中,我们经常需要评估微生物群落结构与环境因子整体之间是否具有显著的相关性,此时,通常使用的方式是Mantel test和普氏分析。普鲁克分析(Procrustes Analysis) 又名普氏分析,是一种用来分析形状分布的统计方法。应用在数据分析中,可以理解为比较两组数据一致性的方法,主要用于表示样品不同方面的数据关联度。在宏基因组测序中, Procrustes分析常用于解释细菌组成与耐药基因的相关性,细菌与功能基因的相关性;在转录

2021-11-17 20:47:54 3134

原创 Prodigal基因预测

Prodigal基因预测在做完宏基因组组装这一步后,接下来要进行基因预测。orf预测的软件有很多,比如MetaGene用的很多,但是这个软件输出结果单一,只有一个文件。后续的orf序列提取和翻译需要自己写脚本完成。因此我选择了Prodigal这个软件,Prodigal预测结果文件十分丰富,包括orf的核酸序列文件、氨基酸序列文件、gff文件等,需要注意的是用于宏基因组orf预测的时候得加-p meta参数。Prodigal(Prokaryotic Dynamic Programming Genefind

2020-10-21 16:06:20 5927

原创 使用Diamond将宏基因组测序数据比对到Nr数据库

对全基因组的基因进行Nr注释是必不可少的一步。由于Nr数据库非常大,导致使用BLAST会消耗巨大的计算资源和时间。使用DIAMOND则能快500-20000倍,而获得和BLAST比较一致的结果。软件安装wget https://github.com/bbuchfink/diamond/releases/download/v0.9.24/diamond-linux64.tar.gztar xzf diamond-linux64.tar.gz可以将diamond添加至环境变量,如果不添加的话,每次使用软

2020-10-06 16:03:33 8934 5

原创 Rstudio绘制PCA图

主成分分析(PCA)使我们能够总结和可视化包含多个相互关联的定量变量所描述的个体/观测值的数据集中的信息。每个变量都可以视为一个不同的维度。 如果数据集中有3个以上的变量,则很难可视化多维超空间。主成分分析用于从多元数据表中提取重要信息,并将此信息表示为一组称为主成分的少量新变量。这些新变量对应于原始变量的线性组合。主成分的数量小于或等于原始变量的数量。给定数据集中的信息对应于其中包含的总变化。PCA的目标是识别数据变化最大的方向(或主要成分)。换句话说,PCA将多元数据的维数减少为两个或三个主要成分,这

2020-09-29 11:49:42 7245 2

原创 生信物种注释软件Kraken2+Bracken的安装与使用

一、软件安装与数据库下载1.Kraken2安装Kraken2是一个基于k-mer算法的高精度宏基因组序列分类软件,能够快速的将测序reads进行物种分类。使用conda一键安装,要先安装好anaconda或者minicondaconda install -y kraken2输入krakek2 --help 出现如下所示帮助文档,则表示安装成功。2.Bracken安装bracken是一种从宏基因组数据中高度准确的计算物种丰度的统计方法。同样使用conda一键安装conda install -

2020-09-29 10:08:22 16910 10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除