- 8月月底参加了菲沙基因的生信线上课程,直播听了一节,讲得有些啰嗦,听不下去,自己又有一些基础,于是凭课件自学。第一章为R背景及基础介绍,没有做过多改动,有兴趣学习的同学可以参加他们的线上课程。
- 1.1 R语言背景
- R语言是诞生于1976年左右的S语言的一个分支。而S语言是由A&T贝尔实验室的John Chambers于1976年开发的一种用来进行数据探索、统计分析、作图的解释型语言。S语言最开始的主要实现版本是S-Plus,他是一个商业软件。后来新西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发了一个R系统。由“R开发核心团队”负责开发。两者在程序语法上是基本一样的,可能只是在函数方面有些细微的差别,所以能够非常容易的相互移植。
- 1.1.1 R语言的优缺点
- 优点:
- R语言是一款自由的软件,他是开放源代码,完全免费的软件,源代码在GitHub上托管,我们也可以在R的网站及其镜像中,获取相关的安装程序源代码以及一些基本的用法资料。
- R具有非常广泛的使用人群,并且R作为一种可编程的语言,当我们学习R语言到一定程度后,能够利用自己学到的东西来自己编制一些自己的函数。同样的,我们也可以利用别人已经制作好的R包来方便快捷的实现我们想要完成的任务。这也使得统计技术的发展能够快速的体现在R中。R和学术界的联系非常的紧密,任何一个领域的新发现都可能附赠了一份R包。
- R在制作图表上面非常具有优势,比如dplyr和ggplot2软件包,非常强大。
- 能够读取很多类型的数据,也可以输出很多类型的数据,可以作为一种粘合语言,连接不同的数据集和工具 。
- R不仅仅适用于高级程序员,R适合一些对于数据处理有需求的人,但是他非常简单,并不需要很深的计算机科学的背景就可以使用,但是另一方面,仅仅学会R的简单使用可能离程序员还差了十万八千里。
- 缺点:
- 首先R是一个有一定历史的编程语言,所以在一些基础的设计上会导致在处理非常大的数据上出现问题。在如何利用现在发展的硬件性能方面也可能存在一定的缺陷。而一些商业软件,如MATLAB在这方面相对就更具有优势。
- R语言对于包的依赖性非常强,假设我们写了一个B包,其中调用了A包,但是有一天A包更新了,采用了和之前不同的实现方式,就可能影响B包的使用。
- 优点:
- 1.2 参考资料
- Goole & Baidu
- An Introduction to R
- R-bloggers
- R语言教程-李东风
- 1.3 R及Rstudio的安装和界面介绍
- windows版本的R的下载地址:https://cran.r-project.org/bin/windows/base/old/
- Rstools下载地址:https://cran.r-project.org/bin/windows/Rtools/history.html
- 1.4 Rstools及package管理
- #CRAN中的包
- #install.packages()
- #生物信息学相关Bioconductor
- #install.packages('BiocManager')
- #BiocManager::install('DESeq2')
- #GitHub
- #install.packages("devtools")
- #devtools::install_github("")
2020.9.4丨生信基础巩固R篇(一)之背景介绍与安装
最新推荐文章于 2023-06-11 15:29:01 发布