在大数据领域词云也不是啥新鲜事了,记得若干年前微博也有生成词云的功能,我的微博最大的关键字好像是“吃”来着……
本文是参考Python 爬虫实战(1):分析豆瓣中最新电影的影评改写而来,python版本为2.7,用的框架是beautiful。
详细内容可进链接学习。
import urllib
from bs4 import BeautifulSoup as bs
CommentList = [];
for a in range(11):
url = 'https://movie.douban.com/subject/11537954/comments?start={}&limit=20'.format(a*20)
resp = urllib.urlopen(url)
html_data = resp.read().decode('utf-8')
soup &