踩的几个坑:
1、403了怎么办?卸载app第二天重安装再登陆【这个方法有点傻 但是我试了有用】
2、正则匹配评论时只能匹配到折叠的评论,不能匹配到短评论怎么办?匹配时开始 结束 分别改为:review-words <div
3、匹配时间的表达式20\d{2}(([^\d]|/s|//|:)?\d{1,2}){5}匹配出现奇怪的一串数字(非时间)怎么办?测试时选择全部匹配【后续导出excel后需要手动删除乱码】
4、爬取评论不完整怎么办?看爬取到的最后一条评论,点击显示网页,确定页数(如89)后建立新任务添加网址时是复制粘贴大众点评上下一页开始的网址(如90),其他的和第一次爬取时一样
八爪鱼爬取大众点评踩坑记录贴【自用
最新推荐文章于 2025-03-19 17:36:55 发布