★★R爬虫
R软件爬虫相关
维格堂406小队
人天生都是软弱的,唯其软弱而犹能承担起苦难,才显出人的尊严。
展开
-
rvest爬取链家网数据
一、工具说明火狐浏览器fireBug插件R软件revest包、stringr包二、数据说明想要获取链家网南京楼盘的信息,如:楼盘名称、地址、面积、是否在售、住宅性质、价格。最后在R里生成数据框 三、代码Part1:加载包,rvest用于爬取数据、stringr处理字符串# 加载包 ------------------------------------------#加载rvest,没有原创 2017-05-07 21:59:50 · 1139 阅读 · 3 评论 -
HTML相关知识---《基于R语言的自动数据收集》
语法规则什么是 HTMLHTML 标签标签举例标签与属性表格看了下书的这一章,简单的记录,而且还未必准确。还是一边看列子,或者直接打开一个网页,不会就查标签含义来的印象深刻和收获大呢。 安利一个网站:http://www.w3school.com.cn/tags/语法规则什么是 HTML?HTML 是用来描述网页的一种语言。HTML 指的是超文本标记语言 (Hyper Text Ma原创 2017-05-04 21:11:09 · 881 阅读 · 0 评论 -
《基于R语言的自动数据收集》--第3章 XML和JSON
Mark~ 明天填坑原创 2017-10-13 17:03:08 · 696 阅读 · 0 评论 -
爬取中国行政区域数据
实际工作需要县以上的行政区域数据,方便做清晰地址数据。 原数据地址:国家统计局原数据格式: 爬取后数据: 代码如下:library(rvest)url <- "http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html"web <- read_html(url)## 爬取原始数据areadata <- w原创 2017-10-15 15:25:08 · 2764 阅读 · 0 评论 -
R爬取对应IP位置数据
用的淘宝接口。 不过貌似封IP,查到第三个就要用20s左右。专业的反爬虫什么的我也不会,晚上放在服务器上跑数据,业务上凑活用吧。# Get_areadata_by_IP("60.191.4.194")## 传入IP返回相关数据library(RCurl)library(bitops)Get_areadata_by_IP <- function(ip_element) { tryCatc原创 2017-10-16 20:26:12 · 1111 阅读 · 0 评论 -
R爬取经纬度对应位置信息
根据给定的GPS数据,爬取对应的位置信息执行代码Get_areadata_by_GPS(location=c("34.59979,119.1974"),ak="yourappkey")执行结果函数脚本######---------Find province and city by GPS---------####### 参考网址【lbsyun.baidu.com/index.php?title=w原创 2017-10-16 20:14:11 · 2448 阅读 · 0 评论