1.读取文件
read.table()
(1)
参数check.names会将行列名中奇奇怪怪的符号转变成“.”,但有时我们并不想这样。例如,读取TCGA样本名时,会将“TCGA-OR-A5J1-01 ”读成了 “TCGA.OR.A5J1.01”,这时我们只需要设置:check.names = F
(2)
其实,读取数据,我更多使用的是“data.table”包,里面的fread()函数读取文件十分便捷,比方说,之前读取TCGA表达谱时,手上这台机器read.table一般得十多分钟,而fread只需要几十秒。
PS:fread()读取数据之后的格式是"data.table"格式的,刚开始用如果觉得不方便的话,可以直接as.data.frame转成"data.frame"格式之后再进行下一步处理。不过还是建议学一下"data.table"格式处理文件的方法,它处理数据运行速度会快很多。我的使用经验:"data.table"格式比"matrix"格式快,"matrix"格式比"data.frame"格式快。
2.PDF输出图片
当按照默认参数输出图形时,可能会出现横纵坐标轴显示不全的情况,设置一下width跟height就好很多啦。
pdf('**/***.pdf',width=15,height=15)
dev.off()