urlib 获取网页

最新推荐文章于 2024-10-09 11:42:00 发布

Jerry_ww

最新推荐文章于 2024-10-09 11:42:00 发布

阅读量84

点赞数

分类专栏：爬虫文章标签： html 网络爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jerryqjr/article/details/130174206

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

将 url 对应的网页下载到本地

eg1

import urllib.request


def get_html(url):
    response = urllib.request.urlopen(url)
    buff = response.read()
    html = buff.decode('utf8')
    return html


if __name__ == '__main__':
    url = "http://www.baidu.com"
    html = get_html(url)
    print(html)

结果：

eg2（with header）

import urllib.request


def get_html(url, headers):
    req = urllib.request.Request(url)
    for key in headers:
        req.add_header(key, headers[key])
    response = urllib.request.urlopen(req)
    buff = response.read()
    html = buff.decode("utf8")
    return html


if __name__ == '__main__':
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36"
    }
    url = "http://www.baidu.com"
    html = get_html(url, headers)
    print(html)

eg3(post请求)

import urllib.request
import urllib.parse


def get_response(url, data):
    data = bytes(urllib.parse.urlencode(data), encoding='utf8')
    response = urllib.request.urlopen(url, data=data)
    buff = response.read()
    result = buff.decode("utf8")
    return result


if __name__ == '__main__':
    data = {
        "key1": "value1",
        "key2": "value2"
    }
    url = "http://httpbin.org/post"
    html = get_response(url, data)
    print(html)

结果：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Jerry_ww CSDN认证博客专家 CSDN认证企业博客

码龄3年

115: 原创

13万+: 周排名

1万+: 总排名

8万+: 访问

: 等级

2210: 积分

966: 粉丝

1013: 获赞

18: 评论

862: 收藏

私信

关注

热门文章

分类专栏

react 2篇
项目部署 1篇
TypeScript 1篇
大模型 3篇
docker 1篇
vue 23篇
vue面试题 2篇
力扣刷题专栏 3篇
数据结构专栏
ES6 1篇
前端小项目 2篇
蓝桥杯Web组 3篇
css面试题 5篇
JavaScript 18篇
Git 6篇
django 2篇
前端 3篇
数据库 12篇
Ubuntu 1篇
算法 3篇
python 15篇
机器学习 4篇
爬虫 3篇

最新评论

【JavaScript】异步函数(async和await详解)
longhee: 写了很多，理解不够透彻..
【Vue】登录功能中对于错误提示信息的重构
百锦再@新空间代码工作室: 这篇文章的亮点在于作者对复杂问题的深入剖析，特别是在第二节中提到的潜在解决方案。这些方案不仅涵盖了各个层面的考虑，而且给出了可行的实施建议。这种全面性和可操作性使得这篇文章非常有价值。
【Javascript】Promise形象比喻
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【Vue3】computed
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【Vue】响应式原理与ref
ha_lydms: 这篇博客真是一次精神的洗礼，让我感到内心清爽而舒畅。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Jerry_ww 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。