转录组学
obwte
善假于物
展开
-
ESTIMATE包计算肿瘤纯度
介绍肿瘤组织中的正常细胞不仅在分子研究中影响肿瘤信号,而且在癌症生物学中也起着重要作用。 估计包使用基因表达数据预测肿瘤组织中基质细胞和免疫细胞的存在。示例首先使用通过Affymetrix U133Plus2.0平台从10个卵巢癌样本中获得的数据。 它具有由17,256个基因(行)和10个样本(列)组成的基因水平表达数据。 其次,将每个微阵列平台的不同基因数量统一为10,412个共同基因。 这...原创 2019-11-05 16:47:24 · 12294 阅读 · 15 评论 -
FPKM、TPM数据标准化
FPKM定义: Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的片段数)公式:FPKMi=Xi(li103)(N106)=XiliN⋅109FPKM_i = \frac{X_i}{(\frac{l_i}{10^3})(\frac{N}{10^6})}=\frac{X_i}{l...原创 2019-10-25 23:32:50 · 23281 阅读 · 3 评论 -
WGCNA:(加权共表达网络分析)
文章目录1 介绍2 名词解释Co-expression networkModuleConnectivityIntramodular connectivity $k_{IM}$Module eigengene EEigengene significanceModule Membership $k_{ME}$Hub geneGene significance GSModule significance3 流...原创 2019-10-09 22:43:28 · 30134 阅读 · 12 评论 -
生存分析
1 KM法计算生存率——非参数模型2 log-rank秩检验比较不同组的生存率2.1 输入数据2.2 建立假设2.3 log-rank秩精确性检验1 KM法计算生存率——非参数模型乘积极限法适用于离散数据,它用于建立时刻 ttt 上的生存函数,根据 ttt 时刻之前的所有时期的生存概率的乘积,来估计时刻 ttt 的生存函数 S(t)S(t)S(t)和它的标准误 SE(S(t))SE(S(t)...原创 2019-09-17 21:08:26 · 3972 阅读 · 1 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 五 :RobustRankAggreg(RRA)整合四个GSE数据集的差异基因,筛选共同差异基因
文章目录论文地址四个GSE数据集差异表达基因(按logFC值排序)并为一个list,正序倒序各一个list所有差异基因在四个GSE数据集中logFC矩阵筛选共同上调基因筛选共同下调基因合并共同上下调基因logFC.tiff论文地址四个GSE数据集差异表达基因(按logFC值排序)并为一个list,正序倒序各一个listsetwd("./2.RobustRankAggreg_analysis"...原创 2019-08-18 15:46:40 · 21460 阅读 · 41 评论 -
芯片数据标准化
原创 2019-08-18 13:50:10 · 2973 阅读 · 0 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 四 :差异表达(GSE65635)
文章目录论文地址GSE65635数据下载到表达矩阵GSE65635数据下载getGEO包下载的探针注释文件不全,需要在GEO网站下载筛选探针分位数标准化预处理分组log2数据转换差异表达表达矩阵分组矩阵差异表达矩阵按照logFC排序保存差异表达矩阵火山图热图,按p值从小到大筛选前100个差异基因(logFC > 1)论文地址GSE65635数据下载到表达矩阵GSE65635数据下载l...原创 2019-08-18 13:22:56 · 6926 阅读 · 4 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 三 :差异表达(GSE37815)
文章目录论文地址GSE37815数据下载到表达矩阵GSE37815数据下载getGEO包下载的探针注释文件不全,需要在GEO网站下载筛选探针分位数标准化预处理分组差异表达表达矩阵分组矩阵差异表达矩阵按照logFC排序保存差异表达矩阵火山图热图论文地址GSE37815数据下载到表达矩阵GSE37815数据下载library(GEOquery) gset = getGEO('GSE3781...原创 2019-08-18 13:10:09 · 8654 阅读 · 2 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 二 :差异表达(GSE13507)
文章目录论文地址GSE13507数据下载到表达矩阵GSE13507数据下载getGEO包下载的探针注释文件不全,需要在GEO网站下载筛选探针分位数标准化预处理分组差异表达表达矩阵分组矩阵差异表达矩阵按照logFC排序保存差异表达矩阵火山图热图论文地址GSE13507数据下载到表达矩阵GSE13507数据下载library(GEOquery) gset = getGEO('GSE1350...原创 2019-08-18 12:56:24 · 8035 阅读 · 9 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 一 :差异表达(GSE7476)
文章目录论文地址GSE7476GSE7476数据下载到表达矩阵GSE7476数据下载getGEO包下载的探针注释文件不全,需要在GEO网站下载筛选探针分位数标准化预处理分组差异表达表达矩阵分组矩阵差异表达矩阵按照logFC排序保存差异表达矩阵火山图热图,按p值从小到大筛选前100个差异基因(logFC > 1)论文地址GSE7476GSE7476数据下载到表达矩阵GSE7476数据下...原创 2019-08-18 11:35:37 · 15251 阅读 · 16 评论 -
复现一篇生信文章有多难,到处都是坑。。。
今天本来打算复现一篇去年发表在 OncoTargets and Therapy GEO数据库整合挖掘的论文,这个杂志素来以灌输闻名,“水的”已经不是SCI了,但是影响因子还是3左右,按理说文章质量应该尚可,而且这又是一篇纯数据挖掘的文章,所以我就去打开了我的Rstudio,开始数据分析,在做到差异表达分析的时候被作者的操作惊到了,到底怎么回事呢,首先我们看看文献中怎么说的,作者首先分析了GDS35...原创 2019-08-11 13:21:45 · 13494 阅读 · 10 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 八 :STRING数据库构建蛋白质相互作用网络(PPI),cytoscape软件筛选hub基因
文章目录论文地址STRING数据库PPI网络构建输入差异基因listPPI图保存结果cytoscape软件筛选hub基因、功能模块输入“string_interactions”文件用cytohHubba插件,筛选top10 Hub基因用MCODE插件,筛选功能模块论文地址STRING数据库PPI网络构建输入差异基因list进入网页,左侧选择“Multiple proteins”,输入所有...原创 2019-08-18 20:20:30 · 32608 阅读 · 2 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 七 :DAVID在线工具进行KEGG富集分析
文章目录论文地址DAVID官网获得KEGG富集分析结果气泡图cytoscape软件绘制代谢通路网络图network datatable data论文地址DAVID官网KEGG富集分析和GO富集分析方法一致,具体步骤见我上篇文章DAVID在线工具进行GO富集分析,这里主要展示可视化结果获得KEGG富集分析结果1.输入文件为所有差异表达基因列表2.选择GO富集分析结果时,我们点击“Path...原创 2019-08-18 17:21:21 · 14558 阅读 · 4 评论 -
2018年SCI论文--整合GEO数据挖掘完整复现 六 :DAVID在线工具进行GO富集分析
文章目录论文地址DAVID官网上调基因GO富集分析进入官网,点击“Function Annotation”选项富集分析选择背景基因选择GO富集分析结果下载富集分析结果保存文件,作为后续可视化的输入文件可视化富集分析结果bp,cc,mf分别提取counts数前5的term条形图圈圈图论文地址DAVID官网上调基因GO富集分析进入官网,点击“Function Annotation”选项富集...原创 2019-08-18 16:38:50 · 14723 阅读 · 11 评论 -
Construction and Validation of a 9-Gene Signature for PredictingPrognosis in Stage III Clear CellRen
目的建立一个多基因信号,以帮助更好地对III期肾细胞癌(RCC)患者的预后进行预测。方法从GEO数据库中下载GSE53757数据集,包括14对癌症和正常组织的表达数据,从TCGA数据库中下载16对mRNA表达谱数据(下载的是RNA-seq测序数据,需要提取mRNA数据)差异表达分析,对共同差异表达基因进行进一步分析。对TCGA中选择肾癌Ⅲ期病例(N=122)进性lasso回归,筛选...原创 2019-08-06 18:00:05 · 314 阅读 · 0 评论 -
edgeR、limma、DESeq2三种差异表达包比较(RNA-seq数据)
1. 加载R包和输入数据rm(list = ls())library("DESeq2")library("limma")library("edgeR")expr = read.csv("mRNA_exprSet.csv",sep = ',',header=T) head(expr)TCGA-mRNA数据链接链接:https://pan.baidu.com/s/1b6l4qg4...原创 2019-08-01 18:22:03 · 30660 阅读 · 22 评论 -
TCGA数据挖掘--神经胶质瘤(GBM)差异mRNA分析
1.TCGA-GBM数据数据{ library(TCGAbiolinks) library(SummarizedExperiment) query <- GDCquery(project = 'TCGA-GBM', data.category = "Transcriptome Profiling", ...原创 2019-07-29 02:04:41 · 16156 阅读 · 54 评论 -
GEO数据挖掘-从数据下载到富集分析-各种绘图(学习笔记)
#################################---------GEO-data1---------#################################rm(list = ls()) source("http://bioconductor.org/biocLite.R") #before install packagebiocLite('DOSE') #...原创 2019-01-16 17:31:11 · 44646 阅读 · 19 评论