4.python爬虫 - 简单动态网页爬(一)

1.首先要理清静态网页和动态网页的区别:

①静态网页指的是网页中没有其他脚本语言(java、php、asp等),只有HTML+CSS(即:超文本标记语言),一般后缀为.html,.htm,或者.xml等。没有数据交互,数据没有动态加载,内容全部在html文件上

②动态网页是指跟静态网页相对的一种网页编程技术。动态网页是有数据交互,连接数据库,还有脚本语言和后台。数据有动态加载。

如图

动态网页在一个页面上可以加载多页数据

而爬取动态数据就必须实现点击翻页的功能

 

2.安装Selenium库以及下载浏览器插件

在pycharm或者打开 Anaconda Prompt ,输入pip install selenium 即可

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值