在python中,selenium完全可以模拟人对浏览器的操作,对动态数据进行获取,动态数据是由代码生成,在页面初始化的过程中无法正常获取,但是,通过selenium却可获取,但是有些数据必须要登录之后才能获取,例如,好友列表、评论。消费记录等等...登陆以后获取cookie,才能进行以下操作,但前提是有账号密码方可实现selenium代替登录。
selenium的特点是:
1.程序控制浏览器进行操作
2.在程序控制浏览器进行操作的时候,速度会非常慢,因此也要谨慎使用selenium(或者设置延时登录 time.sleep(3))
3.在使用sellenium的时候控制浏览器的时候,需要下载浏览器对应的驱动程序
4.要使用selenium的时候,要时刻注意selenium和浏览器之间的关系
对selenium的安装进行步骤操作:
1.在终端打印 pip install selenium
2.在浏览器搜索 geckodriver,获取下载地址https://github.com/mozilla/geckodriver/releases,打开这个网址后
在看到这个