一:工具准备:
语言:python
安装scrapy包建议直接在Anaconda里安装,不易出错。其他安装方式,你懂得~
IDLE:Spyder(Anaconda带的编译器)
二:解析页面:
网址:https://movie.douban.com/top250
页面:
解析:笔者利用火狐浏览器的插件xPath Finder解析网页的源代码,易于查找HTML中元素的定位,在火狐浏览器的插件中即可下载。
定位到需要的爬取的元素。在本次爬取的过程中,需要爬取的元素有电影的排名、名字、得分、打分的人数和影评等。
三.建立工程文件