![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
随笔记
文章平均质量分 86
涂apple
欲戴王冠,必承其重
展开
-
PPI蛋白互作网络构建详细步骤
PPI蛋白互作网络构建详细步骤string数据库是目前数据量最丰富、应用最广泛的研究蛋白质相互作用的数据库之一,收录了超过14000个物种、6千多万种蛋白、200多亿个相互作用的信息。这些蛋白质相互作用既包括直接的物理作用,也包括间接的功能相关性。1. 进入官网(https://string-db.org)之后,点击search,点击之后的界面如下图所示:左侧为选项,有根据单个蛋白名字、单个蛋白序列、多个蛋白名字、多个蛋白序列来构建,这里我们以单个蛋白名字为例进行演示2. 点击Protein b原创 2022-05-20 14:05:09 · 6329 阅读 · 0 评论 -
GO和KEGG富集分析详细步骤
GO和KEGG富集分析文章目录GO和KEGG富集分析@[toc]1. 将差异表达结果的基因名称转化为id2. GO富集分析3. GO圈图绘制4. KEGG富集分析5. KEGG圈图绘制1. 将差异表达结果的基因名称转化为id因为GO和KEGG分析需要用到id,所以这一步需要将基因名字转换为id。具体步骤如下:新建空白文件夹,将差异分析得到的diff.xls复制粘贴到文件夹中因为在这里只需要diff.xls中的基因名称和logFC两列,所以只复制这两列粘贴到新建的文本文件symbol.tx原创 2022-05-20 12:42:32 · 24783 阅读 · 11 评论 -
CPTAC蛋白质差异分析详细步骤
CPTAC蛋白质差异分析文章目录CPTAC蛋白质差异分析@[toc]1. CPTAC数据下载2. 数据补缺校正3. 数据分组4. 蛋白质组差异分析1. CPTAC数据下载根据自己的需求选择对应的癌症,然后下载,这里就不展开讲了。以下为下载的数据目录2. 数据补缺校正从CPTAC下载的蛋白质数据很多都是有缺失值的,这样不利于我们后期分析,所以需要对这些缺失值进行补缺,然后校正(归一化)。首先新建空文件夹名为1_数据补缺校正,将下载的第二个文件(肿瘤文件)复制到空文件夹中然后新建的txt原创 2022-05-20 09:38:53 · 6428 阅读 · 7 评论 -
利用TCGA癌症基因进行差异分析
TCGA癌症基因差异分析步骤文章目录TCGA癌症基因差异分析步骤1. 数据库下载2. 将分散的文件转化为矩阵3. 将矩阵id转化为基因名4. 进行差异表达分析1. 数据库下载进入TCGA数据库官网,根据自己的需求下载各种癌症的数据库,全部勾选好对应的需求之后,下载解释文件(manifest),基因表达量文件(cart),临床数据(clinical),生物多样性数据(biospecimen),样品对应文件(metadata,tcga的id和病人id对应的文件)最终下载的文件如上图所示。2. 将分散原创 2022-05-19 15:16:10 · 7545 阅读 · 2 评论 -
GSEA分析详细步骤
GSEA分组分析文章目录GSEA分组分析@[toc]1. 根据基因文件进行处理筛选2. 文件内容补充及改名3. GSEA软件使用GSEA单基因分析这段时间有空为了某人学习了一下不属于我的领域的东西——GSEA分析(基因富文本分析),下面总结最近所学GSEA分析的步骤及方法。1. 根据基因文件进行处理筛选对于已有的基因文件,一般是xslx或者是csv格式(不要问基因文件哪来的,外行人的我猜测应该是可以从某某网站下载),而这个文件一般排序都是乱的且只有一列,所以这个时候就要进行分列并排序了。如图为基因原创 2022-03-21 11:58:26 · 4847 阅读 · 0 评论