第九讲数据采集：用八爪鱼采集微博评论

最新推荐文章于 2025-03-27 10:44:15 发布

Lyumi

最新推荐文章于 2025-03-27 10:44:15 发布

阅读量1.5w

点赞数 2

分类专栏：数据分析实战文章标签：八爪鱼数据采集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43466427/article/details/85986614

版权

数据分析实战专栏收录该内容

20 篇文章

订阅专栏

在这里插入图片描述
这是专栏里的总结图，这一讲主要是对“八爪鱼”这个数据采集器进行了简要介绍，包括设计流程以及应用案例。
练习：通过八爪鱼抓取豆瓣网上关于《海王》的评论。
（1）输入网页：https://movie.douban.com/
在这里插入图片描述
（2）输入关键词

（3）点击搜索
（4）设置循环翻页（必须先设置循环条件）
（5）选择提取元素
在这里插入图片描述
选择单条内容的最大选择区域，点击选中子元素—选中全部
（6）启动采集
数据量不大时，采用本地采集。

流程视图如下
在这里插入图片描述

导出的xlsx
在这里插入图片描述

出现的问题，只采集到20条数据。
在这里插入图片描述
目前还未找到解决方法，由于在其他网站进行采集时，并未出现这类问题，该网站可能有防采集措施。

关于XPath, 专栏并没有仔细介绍，先搁置下来，以后有需要再深入研究。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。