python爬虫实战学习--泰迪笔记3

最新推荐文章于 2024-07-10 19:27:42 发布

万物皆非

最新推荐文章于 2024-07-10 19:27:42 发布

阅读量459

点赞数

分类专栏：泰迪智能工作室学习文章标签： python 爬虫 pycharm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51683259/article/details/116406521

版权

泰迪智能工作室学习专栏收录该内容

6 篇文章 2 订阅

订阅专栏

第四模块常规动态网页爬取

4.1 概述

静态网页：
在这里插入图片描述
完全可以直接获取网页源代码
动态网页：

网络信息是动态的，无法直接提取。
主流的两种方法：

4.2 逆向分析爬取动态网页

核心：跟踪操作行为，提取有价值的信息，进行合理调动
具体步骤如下：
在这里插入图片描述

在这里插入图片描述

代码实现：

4.3.1 Selenium打开浏览对象

安装下载selenium库和浏览器补丁
在这里插入图片描述
1.sekenium安装：
如下图：

在系统➡高级系统设置➡环境变量➡系统变量（Path）➡新建
将下载好的（一定是符合本版本chrome的（~~某蒟蒻卡了一天~~））chrome driver.exe的位置设置与python同一路径并添加到环境变量中（如图）
在这里插入图片描述
代码实现：

4.3.2 Selenium页面等待

在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python爬虫实战学习--泰迪笔记3

第四模块常规动态网页爬取4.1 概述静态网页：完全可以直接获取网页源代码动态网页：网络信息是动态的，无法直接提取。主流的两种方法：4.2 逆向分析爬取动态网页核心：跟踪操作行为，提取有价值的信息，进行合理调动具体步骤如下：代码实现：4.3.1 Selenium打开浏览对象安装下载selenium库和浏览器补丁1.sekenium安装：如下图：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。