爬虫学习打卡1——urllib库和requests库

最新推荐文章于 2024-07-18 19:48:40 发布

Leo_Huang720

最新推荐文章于 2024-07-18 19:48:40 发布

阅读量795

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/Leo_Huang720/article/details/81392548

版权

本文详细介绍了Python中urllib库的使用，包括构建请求和响应模型，GET和POST数据的传送方式。同时，文章还涵盖了requests库的基础应用，演示了如何通过get和post方法发送HTTP请求并获取HTML数据。每个示例都提供了完整的代码展示，确保了实例的可运行性和学习价值。

摘要由CSDN通过智能技术生成

写在前面的话：每一个实例的代码都会附上相应的代码片或者图片，保证代码完整展示在博客中。最重要的是保证例程的完整性！！！方便自己也方便他人~欢迎大家交流讨论~

urllib库
requests库

环境：Anaconda3（python3.5）

urllib库

使用urllib构建一个请求和响应模型

import urllib
strUrl="https://www.baidu.com/"
response=urllib.request.urlopen(strUrl)
print (response.read())

运行返回：

runfile('F:/Python/SPIDER/1.py', wdir='F:/Python/SPIDER')
b'<html>\r\n<head>\r\n\t<script>\r\n\t\tlocation.replace(location.href.replace("https://","http://"));\r\n\t</script>\r\n</head>

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Leo_Huang720

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

浅谈Python两大爬虫库——urllib库和requests库区别

这家伙很懒，什么都没有留下

01-26

2749

通过对比urllib和requests两个库，我们可以发现它们在功能、使用方式和效率上存在差异。urllib作为Python标准库的一部分，具有稳定性和可靠性，但其API相对繁琐，需要更多的代码来实现相同的功能。而requests作为第三方库，提供了更加简洁和人性化的API，具有丰富的功能和高效的性能。在实际项目中，选择哪个库取决于具体需求。如果你只需要发送基本的HTTP请求并且对性能要求不高，可以使用urllib库。它的标准库地位也意味着无需额外安装任何依赖，这对于某些环境可能是一个优势。

Python3爬虫学习笔记1.1——urllib官方库的使用

王凯盛的博客

08-04

1193

欢迎捧场，上篇我们对什么是爬虫有一个大概的了解，那么我们可以用爬虫来做什么呢？在黑暗中，所有东西都将被揭开。——薇恩

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫之对requests和urllib库的认识和使用(二)

进击的Coder菜鸟

02-18

408

上篇文章已经介绍了urllib库的基本使用，本篇博客介绍requests库的基本使用，爬虫极力推荐requests，看完你就明白辽～。学习之前推荐一个非常好的http测试网站：http://httpbin.org，提供非常非常完善的接口调试、测试功能～ requests库的具体使用 Python里默认是没有requests库滴，安装完Python需要手动安装requests库： p...

Python3 urllib库和requests库

Larry的博客

01-03

316

1. Python3 使用urllib库请求网络 1.1 基于urllib库的GET请求请求百度首页www.baidu.com ，不添加请求头信息： 1 import urllib.requests 2 3 4 def get_page(): 5　　 url = 'http://www.baidu.com/' 6 　　res = urllib.request.ur...

【python学习】爬虫中常使用的urllib和requests库的的背景、定义、特点、功能、代码示例以及两者的区别

最新发布

ya的博客

07-18

1026

requests是基于urllib3，提供了一个更加用户友好的API来发送HTTP/1.1请求

urllib库与requests库

小菜的博客

12-04

274

同样是爬某网站的商品标题 urllib url="http://category.dangdang.com/pg1-cid4008154.html" import urllib.request headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chro...

urllib库与requests库爬虫

Xiang_lhh的博客

04-05

2974

首先介绍urllib库爬取网页内容。需要lxml，urllib库以我的博客为例爬取相关资料 import urllib.parse import lxml.html import urllib.request import time url='https://blog.csdn.net/Xiang_lhh/article/details/104940609' # resp=urllib.req...

我的爬虫学习之路——urllib（urllib2整合到了urllib）

12-22

urllib2在python3后已经合并在urllib中了，具体为urllib.response，urllib.request urllib2.URLError 改为了urllib.error.URLError 文章目录URLError与HTTPError下载网页（requests库也可以） URLError与HTTPError ...

学习爬虫相关的urllib,urllib3库（two day）

12-21

学习`urllib`和`urllib3`对于Python爬虫开发者来说至关重要，因为它们提供了基础的HTTP请求功能，能够满足大部分网络爬取的需求。不过，对于更复杂的情况，如处理JavaScript渲染的页面，可能需要结合使用Selenium、...

网络爬虫必备知识之urllib库

weixin_30548917的博客

11-30

131

就库的范围，个人认为网络爬虫必备库知识包括urllib、requests、re、BeautifulSoup、concurrent.futures，接下来将结合爬虫示例分别对urllib库的使用方法进行总结 1. urllib库全局内容　　官方文档地址：https://docs.python.org/3/library/urllib.html 　　urllib库是python的内置...

【python&爬虫】快速入门urllib库和requests库

xiexianyou666的博客

05-25

1867

文章目录一.urllib库基本介绍二.urllib.request 请求模块1.urlopen方法参数解析1.1.发送get请求1.2.发送post请求（设置data参数）1.3.设置timeout参数1.4.HTTPResponse对象2.构造Request对象三.urllib.parse URL解析模块四.代理服务器1.使用自定义opener对象发送请求2.设置代理服务器五.requests库1.requests库常用类：2.requests库的请求函数3.返回响应Response的常用属性一.url

爬虫Urllib库，Requests库

qq_39027055的博客

10-10

213

什么是Urllib？ Python内置的HTTP请求库。 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser robots.txt 解析模块什么是Requests库 Requests库是用Python语言编写，基于urllib，比urllib更加方便，可以节约大量工作，满足...

python编写爬虫时urllib.request库和requests库的区别

kilig_CSM的博客

02-23

2051

关于urllib.request和requests的区别简单通俗的来说就是前者不如后者更加使用和方便. urllib.request 导入方法： import urllib.request 简介：该模块中的urlopen()方法能对网站发出最基本的请求，在一些没有反爬机制的网站中可以使用该方法去对web网页发送请求，然后解码，从而获得网页. url1 = "http://www.zueb.edu.cn/site/xsgate/xsyw/index.html" print

requests库urllib.request库的对比

qq_43534980的博客

04-08

591

requests库urllib.request库的对比： requests库中的get请求或其他方式的请求 import requests url = "https://www.baidu.com/s" params = "wd=中国" # 查询字符串的方式，不需要像urllib那样还要进行url编码，request请求中的parmas会自动被编码 # params ={"wd":"中国"...

python urllib requests对比_requests库和urllib包对比

weixin_42177768的博客

03-01

176

python中有多种库可以用来处理http请求，比如python的原生库：urllib包、requests类库。urllib和urllib2是相互独立的模块，python3.0以上把urllib和urllib2合并成一个库了，requests库使用了urllib3。requests库的口号是“HTTP For Humans”，为人类使用HTTP而生，用起来不知道要比python原生库好用多少呢，比...

爬虫第一次打卡

zoey678的博客

04-21

400

url="https://movie.douban.com/explore#!type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=0" data={ 'type': 'movie', 'tag': '热门', 'sort':...

爬虫urllib库和requests库

03-16

urllib和requests是Python中常用的网络爬虫库。urllib提供了一组用于访问网络资源的模块，包括用于发送请求、处理响应、解析URL等功能。而requests则提供了一个高层次的接口，使得网络请求更加方便。