- 博客(3)
- 收藏
- 关注
原创 R语言 爬数据
爬数据的两大难点:1.分析网络结构2.写正则表达式科普版:install.packages("RCurl")library(RCurl)url1='http://shenzhen.lashou.com/cate/meishi'web=readLines(url1,encoding='UTF-8')goods_name<-web[grep("goods-name",w
2016-11-30 23:44:55 2782
原创 用R修改excel内容的格式
这篇博客是用来打脸的。去年这个时候写的一篇用vba来生成excel博客提到,R无法修改excel的格式,这回脸打得响了,其实两年前这个技术已经实现,恕我无知。目前从我手上的资料来看,还有几个地方不是特别明白,所以暂时不分享整个实现方法,先占个坑,学会了再贴笔记。资料:https://cran.r-project.org/web/packages/xlsx/xlsx.pdfhttp:
2016-11-19 17:35:57 2313
原创 用R实现模糊匹配
模糊匹配:就是把相似的名词配对起来,案例如,携程爬取下来的景区名称和同城名称并不是完全一致的,但几个关键词是一致的。然后可以通过分词,投票等方法把它们匹配上。library(rJava)library(Rwordseg)setwd("D:\\Documents\\work\\匹配")total_data<-read.csv("门票景区.csv",stringsA...
2016-11-19 17:22:04 15743 13
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人