![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
Wilson-mz
这个作者很懒,什么都没留下…
展开
-
python爬虫-网页解析-xpath/lxml实战
python爬虫-网页解析-xpath/lxml实战xpath介绍xml与html的比较节点选取实战爬取广东教育系统零散采购竞价结果UserAgent代理运行入口代码逻辑用到的xpath表达式及其来源 通过requests请求,返回的数据还是比较粗糙的,我们需要从中找到我们需要保存的信息,这需要对网页内容进行解析。解析方式有正则表达式、xpath、beautiful soup等,这里介绍xpath。 xpath介绍 xpath是一种在xml文档中定位元素的工具,使用xpath对html代码解析前先用lxml原创 2020-08-08 14:14:53 · 1910 阅读 · 0 评论 -
python爬虫-requests请求发送
python爬虫-requests请求发送简介安装使用GETPOST代理cookiesessionhttps的安全验证 简介 requests模块使用起来非常简便,既简单又高效,可以实现多种形式的数据请求。 github地址:github 文档:readthedocs 安装 使用pip安装即可,如果要在虚拟环境使用,记得先激活虚拟环境 $ pip install requests 使用 GET 获取百度首页,简单直接: def get(): response = requests.get("htt原创 2020-07-22 22:11:48 · 345 阅读 · 0 评论