1.首先要理清静态网页和动态网页的区别:
①静态网页指的是网页中没有其他脚本语言(java、php、asp等),只有HTML+CSS(即:超文本标记语言),一般后缀为.html,.htm,或者.xml等。没有数据交互,数据没有动态加载,内容全部在html文件上。
②动态网页是指跟静态网页相对的一种网页编程技术。动态网页是有数据交互,连接数据库,还有脚本语言和后台。数据有动态加载。
如图
动态网页在一个页面上可以加载多页数据
而爬取动态数据就必须实现点击翻页的功能
2.安装Selenium库以及下载浏览器插件
在pycharm或者打开 Anaconda Prompt ,输入pip install selenium 即可
<