我已经尽最大的可能不谈政治,但是,被赶出学校,又没去医院,都是因为疫情。现在做一些R语言心得笔记,感谢头条给的这个免费的网页,如果疫情持续到3月底,那估计我都可以写出一个网站了。
R语言,和其他的C、B、++还有什么PH什么的到底有什么关系,我不清楚,但是我最清楚的是,这R语言,是一个统计学软件,是以code为基础的,和SPASS(这个软件众所周知,是收费的,是图形界面,傻瓜式操作,容易上手,能够输出各种图像和数据,性能不是一般强大,但是就有一个问题,收费的)不一样的操作方式。
R语言最厉害的,最吸引人的,不是因为它功能强大,而是因为它免费。配套RGUI软件使用的是Rstudio界面分割软件。
苍天饶过谁,即便他们老态龙钟换成狼心狗肺(移植)的,也难逃一死。然而那些罪大恶极的他们死后的一百年不被鞭尸,他们的基因还在耀武扬威。这就是我们用R语言研究基因表达的必要性,我们需要鉴别那些特有的,具有区别的基因。
给数据框加上列名test01就是your data.frame
colnames(test01)
保存数据成TXT文件活着CSV文件(txt文件,是个电脑或者手机都能打开,CSV文件用办公软件excel等表格软件打开。)
write.table(test01, file="GOALL.txt",sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)
write.table(test01, file="GOALL.csv",sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)
其实那个解放黑奴的林肯是一个很会演讲的人,林肯讲了一个故事:当时南北双方都面临严峻的问题,奴隶放假时间太长,还天天要吃粮,要取暖,甚至还要吵吵嚷嚷,长时间不干活,奴隶主们觉得白养了奴隶,奴隶太多多的休息,奴隶主太痛心了,休假以后要让奴隶多干活、不休假补偿奴隶主。以保证抗击北方政权的物资储备。没想到,到了交战的后期,林肯被逼的没办法,欲取得奴隶的倒戈,以解决胶着的战争,林肯才成了那个解放黑奴的人。其实没有人愿意解放奴隶。解放奴隶只不过是历史发展的副产物。奴隶是历史上形式不同,概念相同的元素。没有奴隶这个元素,可能会少了一点历史,但是不会改变历史。
对数据进行去重:
##############################################################################################
#####################################################以上是去除@后但是未去重的GLP和表达谱
exprSet9 %
#合并探针的信息
#inner_join(probe2symbol_df,by="probe_id") %>%
#去掉多余列
# select(-probe_id) %>%
#重新排列
select(GENE_SYMBOL,everything()) %>%
#求出平均数(这边的.代表上一步的数据,实际上是exprSet3)
mutate(rowMean =rowMeans(.[grep("GSM", names(.))])) %>%
#把表达量的平均值按从大到小排序
arrange(desc(rowMean))# %>%
# symbol留下第一个
distinct(SYMBOL,.keep_all = T) %>%
#反向选择去除rowMean这一列
select(-rowMean)
事实证明,在R语言里面,如果只是改变行名、列名,还远远不够,因为这样的数据实际上上是没有被系统保存的。系统是不认的。R语言的计算法则,就根本不知道存在着你改名的那列的数据,或者你修改过行名的那列数据,你只是作为人类,自己认为修改了,但是机器没感觉到。着就是人类大脑思维方式和机器思考方式的异同。哪天如果机器思维方式不这么干了,大约,人类就被机器奴役了。显而易见的,将来的世界,必定是智能机器的世界,我们所有的工作、努力,其实就是为了制造控制人类的终极大boss。当然,伺候小boss和伺候大boss,对于普通人没什么两样。因为这些boss,压根不会想你。