爬取腾讯视频网站数据

最新推荐文章于 2023-08-04 16:52:55 发布

缘~

最新推荐文章于 2023-08-04 16:52:55 发布

阅读量7.4k

点赞数 1

分类专栏： R 大数据文章标签： html xml 视频网站 r语言数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/soga_haha/article/details/78765780

版权

1 数据获取

腾讯视频的网站中隐含的是一个非结构化的数据。R语言的“XML”包中htmlParse和getNodeSet非常强大，通过htmlParse可以抓取页面数据并形成树状结构，getNodeSet可以对抓取的数据根据XPath语法来选取特定的节点集合。“revst”包的html_nodes与html_attr可以分别获得节点和属性。
下面是爬取腾讯视频网站中电影数据的一部分关键代码：

1.1加载一些包

library(rvest)
library(XML)
library(dplyr)

1.2 读取页面

腾讯视频中热门电影的显示情况为每页显示30条数据，据此设置要爬取的每个网页的URL依次访问，read_html函数读取网页信息。

num = seq(from=0,by</

最低0.47元/天解锁文章

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
爬取腾讯视频网站数据

1 数据获取腾讯视频的网站中隐含的是一个非结构化的数据。R语言的“XML”包中htmlParse和getNodeSet非常强大，通过htmlParse可以抓取页面数据并形成树状结构，getNodeSet可以对抓取的数据根据XPath语法来选取特定的节点集合。“revst”包的html_nodes与html_attr可以分别获得节点和属性。下面是爬取腾讯视频网站中电影数据的一部分关键代码：1.1加
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。