在mooc上学习了python爬虫,就像自己写一个试试,正好自己也对电影方面感兴趣,所以做了一个关于豆瓣的爬虫。
python版本:3.6
工具:IDLE
爬取内容:TOP250电影的排名,名称,评分
选取网站:https://movie.douban.com/top250
查看源代码(截取部分):
通过这里找到所需提取的信息,编写正则表达式
reRank = r'<em cla
在mooc上学习了python爬虫,就像自己写一个试试,正好自己也对电影方面感兴趣,所以做了一个关于豆瓣的爬虫。
python版本:3.6
工具:IDLE
爬取内容:TOP250电影的排名,名称,评分
选取网站:https://movie.douban.com/top250
查看源代码(截取部分):
通过这里找到所需提取的信息,编写正则表达式
reRank = r'<em cla