- 博客(11)
- 收藏
- 关注
原创 生信技能树生信入门班【Day8】-R语言-基因芯片分析实战篇(GSEA+多分组数据分析+甲基化芯片数据+WGCNA+PPI+机器学习)
因子(Factor)是R语言中用于存储分类数据的特殊数据类型。它可以看作是对字符型数据的扩展,赋予了这些数据更多的结构和含义。
2024-12-08 21:11:39
2153
原创 生信技能树生信入门班【Day7】-R语言-基因芯片分析实战篇
下载并读取数据-有专门为GEO开发的读取数据,自动拆出来表达矩阵、临床信息(分组信息是最重要的)、GPL编号(仪器编号,不同公司不同产品的编号都不太一样,对应了不同的探针注释,我们根据探针去转换成背后代表的基因)载玻片中间的位置有一个像电子芯片一样的“探针”,用探针去探,探出来的探针表达量就代表基因的表达量。数据探索—看分组之间是否有差异、PCA图和热图,相当于是预实验,在差异分析之前看一下数据怎么养。Series 包含整个完整的研究,提供了整个研究的描述,包括对数据的描述、总结和分析GSE。
2024-12-07 19:06:38
385
原创 生信技能树生信入门班【Day6】-R语言的可视化(做图)
箱线图:一个连续型向量和一个有重复值的离散型(/分类型)向量——箱线图有(max、75%、median、25%、min)五个重要的数,竖着的两个封闭箱子的没有用(但是他有离群值,就是max和min不是事实的max和min,是计算出来的)富集分析(ORA、GSEA)(比如说我找出来了500多个差异基因,现在找一下这些基因都是干什么的,有没有一个通路或者GO包含了这500个基因的大部分)log2(FC)=log2(处理组平均值)-log2(对照组平均值)芯片差异分析的起点是一个取过log的表达矩阵(0-20)
2024-12-07 16:11:07
1433
原创 生信技能树生信入门班【Day5】-R语言的可视化(画图)
几何对象几何对象可以叠加:一个geom函数画出来的所有东西称为一个几何对象(高级绘图函数加一低级绘图函数位置geom_jitter()geom_point(position = "jitter")主题theme_bw() 改主题,可以去掉灰色格子数据多的东西一般gpt写的都比较好,ggplot2的函数一般不会写错,单手molecule3写的人比较少就不太好ggpubrstat_compare_means(comparisions = my_comparisons,1
2024-12-07 11:28:58
258
原创 生信技能树生信入门班【Day4】-R语言的可视化(做图)
文件读取delim可以读取.gz格式文件?是这个意思吗?delim默认分隔符是制表符tab很多时候read.delim的作用比read.table要好用很多read.delim可以替代read.table,学习read.table的作用是能看懂别人的代码R语言中和Excel中打开的有区别(1)[1,1]出现一个“x”字符(2)列名改了,“-”号在R语言中读取出来变成了“.” ——因为“-”在R语言中是一个特殊字符,所以在R里自动给改成了非特殊字符的“.”
2024-12-06 17:19:31
416
原创 生信技能书生信入门班【Day3】-R语言的函数和R包(数据框Dataframe、矩阵Matrix、列表List)
seq是函数形式参数:模板,由函数作者所设置,可以不写实际参数:实参,使用者可以改动,可以赋值。
2024-12-02 22:06:47
382
原创 生信技能书生信入门班【Day2】-R语言的数据结构(数据框Dataframe、矩阵Matrix、列表List)
R语言独特的变量保存格式:Rdata用于储存有用的变量,准备下次使用load之后可以把储存的所有变量load出来练习题为什么intersect的结果不对?理论上不是应该就是交集吗?因为intersect没有去重复的能力,%in%是能够去重复的输出结果是这样的?为什么?因为小于号和减号连在一起<-就变成了标准的赋值符号了所以应该在小于号和减号之间加一个空格在小于号和减号之间加一个空格就可以破坏正统赋值符号了。
2024-12-02 15:29:38
1438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人