自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 R语言 爬数据

爬数据的两大难点:1.分析网络结构2.写正则表达式科普版:install.packages("RCurl")library(RCurl)url1='http://shenzhen.lashou.com/cate/meishi'web=readLines(url1,encoding='UTF-8')goods_name<-web[grep("goods-name",w

2016-11-30 23:44:55 2782

原创 用R修改excel内容的格式

这篇博客是用来打脸的。去年这个时候写的一篇用vba来生成excel博客提到,R无法修改excel的格式,这回脸打得响了,其实两年前这个技术已经实现,恕我无知。目前从我手上的资料来看,还有几个地方不是特别明白,所以暂时不分享整个实现方法,先占个坑,学会了再贴笔记。资料:https://cran.r-project.org/web/packages/xlsx/xlsx.pdfhttp:

2016-11-19 17:35:57 2313

原创 用R实现模糊匹配

模糊匹配:就是把相似的名词配对起来,案例如,携程爬取下来的景区名称和同城名称并不是完全一致的,但几个关键词是一致的。然后可以通过分词,投票等方法把它们匹配上。library(rJava)library(Rwordseg)setwd("D:\\Documents\\work\\匹配")total_data<-read.csv("门票景区.csv",stringsA...

2016-11-19 17:22:04 15743 13

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除