现在又用到R语言了,当年学习的时候,很多函数用的都很熟练,没想到现在竟然忘了一大截。。。写个笔记还是很有必要的。。持续更新……
此处作目录
- 连接mysql的操作
- 数据框的合并(merge)
- 数据框去重(news=news[!duplicated(news),])
- 输出表格csv
- 删除某些列有na的行final_news=news[complete.cases(news[,'shoucang']),]
1.连接Mysql
(1)先去控制面板ODBC数据源处新建数据源。
(2)R代码如下
library(RODBC) #加载库
myconn<-odbcConnect("mydb",uid="root",pwd="12345",DBMSencoding="utf-8") #创建连接
sqlTables(myconn) #显示所有的表
news_total<-sqlQuery(myconn,"select * from news_total") #执行查询后的结果存入帧中
news_detail<-sqlQuery(myconn,"select * from news_detail") #执行查询后的结果存入帧中
close(myconn) #关闭连接
2.数据框合并
如下为左连接
news=merge(news_total, news_detail[,2:6],by.x ="entity_id",by.y = "entity_id",all.x = T )
4.输出表格
write.csv(b,"C:\\Users\\jmw\\Desktop\\queshi.csv",fileEncoding = "utf-8",row.names=F)