适合开发人员的网页爬虫工具DrissionPage

最新推荐文章于 2024-10-29 18:40:12 发布

易道合之逍遥峰

最新推荐文章于 2024-10-29 18:40:12 发布

阅读量1.4k

点赞数 27

文章标签：爬虫网络爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mopmgerg54mo/article/details/141495715

版权

DrissionPage是一个基于Python的网页自动化工具，它集成了Selenium和Requests的功能，既能够控制浏览器进行用户界面的模拟操作，也能够直接收发数据包进行数据的获取和处理。

开源地址：DrissionPage: 基于python的网页自动化工具。既能控制浏览器，也能收发数据包。可兼顾浏览器自动化的便利性和requests的高效率。功能强大，内置无数人性化设计和便捷功能。语法简洁而优雅，代码量少。https://gitee.com/g1879/DrissionPage

相信很多开发人员都用到过selenium和requests作为网页爬取的工具，下面简单对比一下使用DrissionPage和同类型产品的代码复杂度，而且更加重要的是DrissionPage支持更多高级功能，能够让你快速完成对网页信息的提取和接口监听。

先来对比requests：

url = 'https://baike.baidu.com/item/python'

# 使用 requests：
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36'}
response = requests.get(url, headers = headers)
html = etree.HTML(response.text)
element = html.xpath('//h1')[0]
title = element.text

# 使用 DrissionPage：
page = WebPage('s')
page.get(url)
title = page('tag:h1').text

最低0.47元/天解锁文章

易道合之逍遥峰

关注

27
点赞
踩
29

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

易道合之逍遥峰 CSDN认证博客专家 CSDN认证企业博客

码龄12年

254: 原创

8473: 周排名

7191: 总排名

18万+: 访问

: 等级

5555: 积分

2026: 粉丝

2887: 获赞

20: 评论

2373: 收藏

私信

关注

热门文章

分类专栏

人工智能 12篇
开源工具 46篇
前端 11篇
数据库 12篇
java 31篇
android 1篇

最新评论

开源流媒体转码Java服务easy-flv
cainiaowannfly: 这个脚本https://cdn.jsdelivr.net/npm/flv.js@1.5.0/dist/flv.min.js，访问不了了
开源流媒体转码Java服务easy-flv
cainiaowannfly: 大佬，你这个有简化的空间吗，我就window,linux用，打完包1.35G，太大了
开源免费的表单收集系统TDuck
想吃榴莲啦: 开源免费版不支持表单回显吗
开源前端埋点监控插件Web-Tracing
新手sddf: 请教下，如果客户刚打开页面就立马关闭了，会推送访问记录吗
开源流媒体转码Java服务easy-flv
aljgfbv: 哥你是easy-flv的作者吗问个问题就是整合了easy-flv后发现第一个访问接口的前端会报错提示the play() request was interrupted by a call to pause 但是后面的客户端都能正常显示有什么解决办法吗

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

易道合之逍遥峰 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。