什么是R?
R时最受欢迎的数据分析和可视化平台之一。首次出现在1993年;2011年随大数据的爆发而流行起来
为什么选择R?
(1)免费、开源、支持 Windows/Mac OS/ Linux。
(2)R可以完成数据分析设计的几乎所有步骤,如图
(3) 大数据分析竞赛 https://www.kaggle.com/
R可以做?
(1)探索性数据分析
探索性数据分析是数据分析中的必要步骤,可以了解数据,作图
(2)统计推断
统计推断是基于数据得出正式结论的过程。结论+结论是错误的概率
(3)回归分析
线性模型拟合数据
-预测变量
-结果变量
预测
(4)机器学习
训练模型+预测
分类问题
开发数据产品
(1) GoogleVis API
-R制作html, 调用Google charts ,生成交互式html图标
(2) Manipulate
(3) rCharts
-使用R制作交互式javascript可视化产品
(4) Shiny
-制作嵌入网页的交互式R程序的平台
(5) Slidify
-制作和发布基于R的报告(ppt)
Mac OSX搭建R环境
安装R 下载地址 :https://cran.r-project.org/
安装Rstudio 下载地址:https://www.rstudio.com/products/RStudio/
简单使用
(1)安装包
在RStudio 控制台输入 install.packages(“包名”)
包可以在 cran.r-project.org 下寻找
(2)加载包
library(包名)
(3)R中自带的数据集(可以用来学习和练习)
data() (会显示所有的数据集)
?数据集名称 (查看数据集的详细信息)
(4)获取帮助
?函数名 (R的帮助文档)
实战
install.packages('quantmod') # 安装quantmod包
require(quantmod) #引用quantmod包
getSymbols("GOOG",src="yahoo",from="2014-01-01", to='2014-04-24') #从雅虎财经获取google的股票数据
chartSeries(GOOG,up.col='red',dn.col='green') #显示K线图 > addMACD() #增加MACD图
效果如图