1.1 下载、探索数据
对照视频教材:
代码资源可在腾讯微云网盘上寻找:文件分享
本例从P4 2.1开始进行笔记记录及整理。本文档主要是操作中的细节补充,相应的代码及思路在原始的代码中已经注明,因此无需特殊补充。
文件下载 例如GSE84465,可于GEO网页上寻找
下载csv.gz文件,download的http网址即可
先基于setup0安装所有的包。
注意工作文档和下载下的文件最好在一个文件夹下,方便后续调取取用。
看1-4列及1-4行初步看一下基因表达矩阵。
列名此时是sample,是根据sample情况决定的。行名是symbol ID。
后续是对矩阵进行基本描述
### 1、下载、探索、整理数据----
## 1.1 下载、探索数据
#https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE84465
sessionInfo()
# 读取文件耗时比较长,请耐心等待
a <- read.table("../../rawdata/GSE84465_GBM_All_data.csv.gz")
a[1:4,1:4]
#行名为symbol ID
#列名为sample,看上去像是两个元素的组合。
summary(a[,1:4])
boxplot(a