爬取《全职高手之巅峰荣耀》的豆瓣影评，分析漫改电影的优劣好坏

北房有佳人

于 2019-08-19 17:36:10 发布

阅读量1.8k

点赞数 1

分类专栏：爬虫应用文章标签：豆瓣影评全职高手之巅峰荣耀

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mygodit/article/details/99742542

版权

周末去看了《全职高手之巅峰荣耀》的大电影。记得是看扫毒2还是更前一点的电影时。全职大电影的预告片就出来了，第一眼看中的时候，就决定必须去看这场电影了。（每周一场的电影，默认成为习惯了）
电影的好处在于，可以暂时脱离本身的角色设定，转而融入电影中的某个背景，感受不同的生活体验，精神感受，以及揣摩导演，制作者的一些小心思。理解电影想表达什么，理解制作者在某个小细节上的精彩处理，这也是看电影的一种另类收获。

电影相对于原作来说，可以更生动，更完美的表达出人物之间的关系。具体情境下的环境感受。有人在看到某个熟悉的场景时会情不自禁的代入。见过有在电影院痛哭流涕的，也有某个激动的场景，大家一起呐喊助威的。电影的魅力就在于此。

想起在看《毒液》时，前面有个小弟弟一直在眉飞色舞的给小伙伴解说人物关系，故事剧情（当时很想锤他一顿，O(∩_∩)O哈哈~）

<全职高手>作者是蝴蝶蓝，讲述的是一个荣耀新人叶不修，因为自身开挂太过严重，而导致被俱乐部封杀，结果又凑齐了各种挂壁一起殴打俱乐部，脚踏前妻的故事。故事很精彩，角色设定也很出色。是个值得一看的网瘾小说。

咳咳，还是先做正事要紧，鉴于对这部大电影的期待，决定爬取豆瓣的影评，分析分析这部电影的优劣好坏。

爬取豆瓣影评

找到电影的影评页面（一眼望去全是差评啊，我滴个乖乖）
在这里插入图片描述

确定我们需要的信息字段，分别是影评人，评论，评价，评价日期，以及点赞的人数。

评价在网页上显示的是星级，而在html文件中@title属性中是对应的标准。

如下所示:

在这里插入图片描述

四星 = ‘推荐’，一星=‘很差’，二星=‘较差’，三星=‘还行’，五星=‘力荐’.

豆瓣的整体页面结构算是简单的没有特别复杂的网页嵌套，我们就选用requests请求，这样的请求过程清晰简单，方便修改。

找到需要字段的xpath规则，也可以用css选择器，具体按自己需要来选择。
在这里插入图片描述
所有的影评内容都在id="comments"的div标签下，每一页有20条数据。

需要将20条信

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。