第一章 R基础知识
R既是一套计算机语言,也是一个软件
1.1 R语言的特点
- 功能强大且扩展性强
- R语言的库函数以扩展包的形式存在,R包的安装和调用应该类似于Python(R的运行速度只有Python的一半,R能实现的Python全能,只是实现方式可能没有R直接(其实就是R对症下药,在某些方面做了优化,编程语言的内卷),Python能实现的R表示无能为力)
- 编程简单且交互性强
- 感觉这是编辑器Rstudio的功劳
- 与其他编程语言或软件配合方便
- 这一点R卷不过Python
- 跨平台
- 开源和免费
- 强大的社区支持
- 方便撰写分析报告
1.2 R的缺点
- 严重消耗内存
- 运行效率低(上面提过了,数据量大了考验耐心?)
- 版本兼容性的问题
- 源代码读不懂?(要多学)
1.3 R语言的主要用途
- 统计与绘图
- 与Python的scipy对标 ,机器学习和sckit-learn对标
- 互联网数据挖掘
- 金融分析
- 生命科学
1.4 R语言的集成开发环境(RStudio)
类似于Python的Spyder
- RStudio的页面直观而简洁
- 四大板块:Source、Console、History、Help
- 多种编程辅助工具
- 傻瓜式操作很香
- Rstudio支持在文档中混编代码
RStudio支持Rnw和Rmd文件格式
Rnw文件混合编写Tex代码和R代码(前提是会Tex代码),两种代码交替调用,生成的报告对R代码自动语法高亮,运行结果自然插到报告中。
Rmd文件混合编写Markdown代码和R代码,Markdown好学多了。
下面这篇文档是我用R+Markdown完成的
---
title: "R+Markdown"
output:
word_document: default
pdf_document: default
---
## 1.安装RStudio和knitr包
### Install Bioconductor Packages
```{r}
if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install()
Upgrading installed Bioconductor packages
if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install()
BiocManager::install(c("knitr"))
2.打开RStudio点击Tools,进入Options进行设置,在Sweave中操作
3.然后根据Markdown语法编写文本
4.当需要插入R代码时,点击右上角添加R的Chunks
5.点击上方Knit生成文件
1.5 三板斧搞定R语言
- 安装和加载需要的扩展包
- 设定工作目录,并保证输入数据的存在
- 复制粘贴代码,运行程序
1.6 简单的语法知识
1.6.1 变量
Python是"=“,R是”<-“,感觉”="直观
1.6.2 函数
R语言中所有操作都是由函数完成的
1.6.3 综合案例
readHTMLTable() #读入HTML格式的表格
names() #取一个表格各列的名称
as.numeric() #将向量转变为数值类型
as.Date() #将向量转变为时间格式
ggmap(), get_googlemap(), geom_point(), opts() #这四个函数组合用于画图
readHTMLTable() #读入HTML格式的表格
names() #取一个表格各列的名称
as.numeric() #将向量转变为数值类型
as.Date() #将向量转变为时间格式
ggmap(), get_googlemap(), geom_point(), opts() #这四个函数组合用于画图