R语言实现简单的网页数据抓取

最新推荐文章于 2024-07-20 09:40:11 发布

凌岸_鸿

最新推荐文章于 2024-07-20 09:40:11 发布

阅读量2.5w

点赞数 7

分类专栏： R 文章标签： R r语言

本文链接：https://blog.csdn.net/lingan_Hong/article/details/55549380

版权

R 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

在知乎遇到这样一个问题。

https://www.zhihu.com/question/26385408/answer/147009602

这是要爬取的内容的网页：
这里写图片描述

R语言的代码的实现方式如下：

#安装XML包
>install.packages("XML")
#载入XML包
> library(XML)
#确定网页地址，通过网页地址分析网页表格
> url<-"http://hz.house.ifeng.com/detail/2014_10_28/50087618_1.shtml"
> tbls<-readHTMLTable(url)
> sapply(tbls,nrow)
NULL NULL 
  93    8 

#读取网页url的第一张表
> pop<-readHTMLTable(url,which = 1)
#存储pop为CSV文档
> write.csv(pop,file="F:/pop.csv")

我们还可以保存为其他格式：

#保存为简单文本：
>write.table(x, file = "*.txt")
#保存为R格式文件：
>save(x, file = "*.Rdata")

这里写图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

凌岸_鸿

关注关注

7
点赞
踩
68

收藏

觉得还不错? 一键收藏
3
评论
R语言实现简单的网页数据抓取

在知乎遇到这样一个问题。https://www.zhihu.com/question/26385408/answer/147009602这是要爬取的内容的网页： R语言的代码的实现方式如下：#安装XML包>install.packages("XML")#载入XML包> library(XML)
复制链接

扫一扫