python爬虫学习之视频评论抓取

最新推荐文章于 2022-06-13 11:56:53 发布

weixin_30484247

最新推荐文章于 2022-06-13 11:56:53 发布

阅读量275

点赞数

文章标签：爬虫 python

原文链接：http://www.cnblogs.com/tian2B/p/10878392.html

版权

爬虫学习的一点心得

任务：抓取某视频评论并下载

抓取：requests

解析：xpath，正则表达式

遇到的问题：

1.有些data参数使用的时间戳（由13位组成），每次访问的时间戳不一样，如果每一页爬取该参数值均一样可能导致爬取错误，需要自动生成时间戳：用time.time()*1000即可。

2.爬取多页数据时，发现中间某些页报错导致无法全部获取到页面信息（本次爬取时候发生报错，只爬取到部分页面评论），进行异常捕捉，可以准确定位问题，也可以跳过问题页面，不至于终止爬取后面正常页面信息。

转载于:https://www.cnblogs.com/tian2B/p/10878392.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注