自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 clusterprofiler包进行GO与KEGG富集分析

RNA-seq寻找到差异基因后,对比GO与KEGG库进行差异分析rm(list = ls())options(stringsAsFactors = F)DEG <- read.csv('./DEGs_filter.csv', header = T, row.names = 1)gene <- DEG$Entrezidgenelist <- data.frame(DEG$Entrezid, DEG$log2FoldChange)head(genelist)dim(gen

2021-09-18 10:20:52 1445

原创 安装clusterProfiler包出错

> BiocManager::install("clusterProfiler")'getOption("repos")' replaces Bioconductor standard repositories, see'?repositories' for detailsreplacement repositories: CRAN: https://cran.rstudio.com/Bioconductor version 3.12 (BiocManager 1.30.16),.

2021-09-16 23:16:43 7896 5

原创 第1列与其他所有列的相关性分析,并做森林图与散点图

临床研究中,经常需要进行相关性分析,因此编写代码如下:rm(list = ls())options(stringsAsFactors = F)library(openxlsx)a <- read.xlsx('./AAV_analysis.xlsx', sheet = 1, colNames = T)## 将数据库中的数值转换为数值型for (i in 1:ncol(a)) { a[,i] <- as.numeric(a[,i])}## 计算相关性系数与p值liu

2021-09-16 20:25:17 627

原创 R语言Limma包分析RNA-seq数据

# 清空环境rm(list = ls())options(stringsAsFactors = F)# 读取counts矩阵counts <- read.csv('./UUO-Sham_count.csv', header = T, row.names = 1)counts <- counts[, -1]# 构建DGEList objectlibrary(edgeR)y <- DGEList(counts = counts)# Filtering: keep ge.

2021-09-09 22:19:44 2593 1

原创 RNA-seq 原始counts数据进行标准化

RNA-seq的counts数据一般要进行标准化才能进行下游分析,常见的有FPKM与TPM两种方式,现在已知counts数据与基因的长度,求FPKM与TPM,代码如下:rm(list = ls())options(stringsAsFactors = F)rawcount <- read.csv("./ALL_sample_gene_count.csv", header = T, row.names = 1)rawcount$gene_name <- rownames(rawcou.

2021-09-06 23:06:39 7475 3

原创 计算基因长度并替换gene名

#BiocManager::install('GenomicFeatures')library(GenomicFeatures)txdb <- makeTxDbFromGFF("./gencode.vM27.annotation.gtf",format="gtf")# 通过exonsBy获取每个gene上的所有外显子的起始位点和终止位点,然后用reduce去除掉重叠冗余的部分,最后计算长度 -----------exons_gene <- exonsBy(txdb, by = .

2021-09-05 23:48:03 1077

原创 R语言DEDeq2包进行RNA-seq分析总结

最近在学习DESeq2包进行RNA-seq分析,并画火山图,分析代码总结如下:rm(list = ls())options(stringsAsFactors = F)## 读入counts数据exprSet <- read.csv("./DEGs_spleen.csv", header = T, row.names = 1)exprSet <- exprSet[,-1]View(exprSet)## DESeq2进行差异分析suppressMessages(library

2021-09-05 18:38:31 1938

原创 R语言常用基础命令总结

1. 当某个函数使用有冲突时,可以在函数前面加上相应包的信息:dply::filter ()

2021-09-04 10:51:49 818

原创 RNA-seq中遇到的问题(2)

自己找公司进行RNA-seq测序,得到counts数据后,用DESeq2包进行差异分析,得到的结果log2FC, pvalue, padj与公司的结果差别很大,公司也是用的DESeq2包进行的分析。经过3天的寻找,终于找到了原因。在DESeq2包中进行差异分析,counts matrix只能包含需要比较的2组数据,如果还有其他组的数据,则会导致出来的结果有差异。如果一次测序分了3组以上,合适的做法是将大矩阵拆分为需要比较的2个组的小矩阵。进行DESeq2分析的代码如下:rm(list = ls

2021-09-03 23:20:54 765

原创 RNA-seq中遇到的问题(1)

在得到RNA-seq的counts数据后,需要进行标准化。标准化需要得到基因的长度信息,因此需要下载相应种属的GTF文件。在https://www.gencodegenes.org/上可以下载人和小鼠的GTF文件(在NCBI上下载的GTF文件运行出错,原因还没有找到)。然后用count2FPKM进行计算,代码如下library(GenomicFeatures)txdb <- makeTxDbFromGFF("./gencode.v38.annotation.gtf",format="gtf"

2021-09-03 22:38:49 701

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除