python 爬取豆瓣电影评论,并进行词云展示
本文旨在提供爬取豆瓣电影《我不是药神》评论和词云展示的代码样例
- 1、分析URL
- 2、爬取前10页评论
- 3、进行词云展示
1、分析URL
我不是药神 短评
第一页url
https://movie.douban.com/subject/26752088/comments?start=0&limit=20&sort=new_score&status=P
第二页url
https://movie.douban.com/subject/26752088/comments?start=20&limit=20&sort=new_score&status=P
…
…
…
第十页url
https://movie.douban.com/subject/26752088/comments?start=180&limit=20&sort=new_score&status=P
分析发现每次变化的只是…strat=后面的数字,其他内容不变,可以以此遍历每一页的评论。
2、爬取前10页评论
# -*-coding:utf-8-*-