- 博客(1)
- 收藏
- 关注
原创 爬虫入门超清晰csv加正则表达式爬取虎扑评论(源码)
将我们的url路径复制并指定,如果说是多页面爬取我们不能对url写死,具体操作下次会发布。该段代码实现的是创建一个名为威少的csv文件,表头写入用户及评价,通过对结果列表的长度的遍历,将结果挨个写入文件,很多时候会出现乱码现象,这个可以使用notepad++对文本编码格式指定UTF-8来解决。由于我们所需要爬取的是评论用户名及其发布的评论,我们需要对两者通过正侧表达式筛选,常用的也有Xpath,网页元素的筛选我们可以通过浏览器控制台的指向功能超找到元素所在标签。有了数据接下来我们要对数据进行写入。
2023-03-30 19:39:50 1307 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人