自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 爬虫入门超清晰csv加正则表达式爬取虎扑评论(源码)

将我们的url路径复制并指定,如果说是多页面爬取我们不能对url写死,具体操作下次会发布。该段代码实现的是创建一个名为威少的csv文件,表头写入用户及评价,通过对结果列表的长度的遍历,将结果挨个写入文件,很多时候会出现乱码现象,这个可以使用notepad++对文本编码格式指定UTF-8来解决。由于我们所需要爬取的是评论用户名及其发布的评论,我们需要对两者通过正侧表达式筛选,常用的也有Xpath,网页元素的筛选我们可以通过浏览器控制台的指向功能超找到元素所在标签。有了数据接下来我们要对数据进行写入。

2023-03-30 19:39:50 1307 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除