自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 Python爬取豆瓣电影短评并保存为表格

爬取思路:通过requests请求直接请求url得到网页的原html代码,豆瓣的短评都是直接储存到html当中的,所以直接使用xpath对网页进行解析并爬取即可得到评论的时间,内容和评价。接下来是代码部分,我就将整个代码放进来了,只要导入对应的库应该都是可以正常运行的。1.豆瓣评论在网页html里使用的是力荐、推荐等字眼,我将其转换成了数字形式保存。2.其中的output_file_path我们需要换成我们自己储存的文件路径。通过相同的方法,我们可以得到评论的时间、评价等内容。使用的浏览器:google,

2024-03-28 22:18:00 498

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除