爬取房源信息+处理（R语言）

最新推荐文章于 2021-11-13 22:47:47 发布

:-Xl will be

最新推荐文章于 2021-11-13 22:47:47 发布

阅读量425

点赞数 1

分类专栏：笔记文章标签：大数据

本文链接：https://blog.csdn.net/weixin_45585609/article/details/113859208

版权

本文介绍了如何使用R语言从链家网站爬取房源信息，并进行初步的数据处理，涉及到网络爬虫与数据清洗技术。

摘要由CSDN通过智能技术生成

爬取信息，并对其进行处理

此次操作的网站是链家，详细代码如下：

install.packages("pacman")
pacman::p_load(XML,rvest,jiebaR,dplyr,stringr)

house_inf=data.frame()

for (i in 1:500){
   
  web=read_html(str_c("https://xa.lianjia.com/ershoufang/",i),encoding = "UTF-8")
  house_name=web%>%html_nodes(".item a"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

:-Xl will be

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
爬取房源信息+处理（R语言）

爬取信息，并对其进行处理此次操作的网站是链家，详细代码如下：install.packages("pacman")pacman::p_load(XML,rvest,jiebaR,dplyr,stringr)house_inf=data.frame()for (i in 1:500){ web=read_html(str_c("https://xa.lianjia.com/ershoufang/",i),encoding = "UTF-8") house_name=web%>%htm
复制链接

扫一扫