第一种方法通过selenium破解登陆问题:
视频教学:https://www.bilibili.com/video/av66011301/
爬取网站:http://58921.com/
目标爬取:‘2019年内地票房排行榜’
当爬取到第三页时问题就来了:
必须通过登陆才能访问到后面的数据
1.pip install selenium
2.百度搜索 “Chormedriver” 链接"http://npm.taobao.org/mirrors/chromedriver/"(我用的是chrom)
查看你chrom的版本
寻找和版本最近的包
下载win32位(win64也能用)
下载解压之后放在python下Script