前言
- 论及数据分析一定避不开数据来源。今天我们就从内部数据的源头——数据库开始,通过读取报表、合并报表、拼接报表、汇总报表,来看看数据分析在数据层面的应用。
载入需要的工具包 & 连接数据库
- R语言中连接数据库的方式主要有两大类,一种通过ODBC的形式,另一种通过DBI接口的形式。考虑到数据传输效率,这里我们使用了后者。
- 使用DBI接口连接MySQL的过程非常简单,注册MySQL驱动,提交账户密码,一行代码就可以搞定连接。而且对于其它类型的数据库 ,我们只需要改动数据库接口,在R语言中访问数据库的代码 依然可以照常运行。
# 连接数据库
library(DBI)
library(RMySQL)
library(dplyr)
con <- dbConnect(MySQL(), user = "xxx", password = "xxxxxxxxx")
查看数据库中有哪些报表
# 使用csnd数据库
dbExecute(con, "use csnd")
# 查看数据库中有哪些报表
dbListTables(con)
- 如图所示,我们的数据库中有五张报表。每张报表都由三个字段组成,分别是城市、年份、以及一个与报表名称相同的字段。
合并报表