python urlopen返回的是啥类型,python的urlib2判断web服务器返回资源的类型

李大姨

于 2021-03-25 12:22:38 发布

阅读量315

点赞数

文章标签： python urlopen返回的是啥类型

一般情况下，我们从网络上抓资源会这样写代码：

try:

request = urllib2.Request(url)

response = urllib2.urlopen(request, timeout = 10)

except:

print traceback.format_exc()

content = cStringIO.StringIO(response.read())

但是网络上的资源有很多的不确定性。比如，我想抓取一个图片文件，但是服务器因为内部错误返回一串字符串；或者返回一个error code。

因此这要求我们在读取内容之前，需要判断一下某些状态是否正确。例如：

response = None

try:

request = urllib2.Request(url)

response = urllib2.urlopen(request, timeout = 10)

except:

print traceback.format_exc()

# 判断返回码是否是正常

if response.code < 200 or response.code >= 300:

print "some error found"

# 判断content type是不是image的

if response.headers.type is not None and response.headers.type.find("image") != -1:

print "this is an image resource"

else:

print "not an image"

# 再读取资源

content = cStringIO.StringIO(response.read())

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李大姨

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python urlopen返回的是啥类型,python的urlib2判断web服务器返回资源的类型

一般情况下，我们从网络上抓资源会这样写代码：try:request = urllib2.Request(url)response = urllib2.urlopen(request, timeout = 10)except:print traceback.format_exc()content = cStringIO.StringIO(response.read())但是网络上的资源有很多的不确定...
复制链接

扫一扫

urlopen方法会返回一个response对象_金融数据的获取——一个爬虫的简单例子

weixin_31108825的博客

01-09

672

对量化投资策略进行研究，第一步就是获取我们需要的数据。使用历史数据能够对策略进行回测，以验证策略的有效性和可信性。另一方面，量化投资本身也是一种对数据的研究，因此它也必须遵循数据分析的相关步骤。作为一个业余的量化投资爱好者，免费的数据来源主要有以下几种途径：Yahoo、Sina 财经的APIPython的Tushare包自己手工爬取 Tushare是一个免费、开源的P...

Python爬虫判断url链接的是下载文件还是html文件

u014209688的专栏

10-05

8964

最近在写一个网络爬虫的代码，提供命令行来下载文件或者是打印根域名下指定节点及深度的子节点。用的是urllib2库，算是比较简单，但是功能并没有很强大。说重点吧，在实际爬网页的过程中，一般的过程是一次调用下面的三个函数： req = urllib2.Request(url) response = urllib2.urlopen(req) html = response.read() 所得到链

参与评论您还未登录，请先登录后发表或查看评论

python urlopen返回的是啥类型_数据爬虫：urlopen返回的应答对象respose两个常用方法...

weixin_39968852的博客

12-16

772

1.info()这个是返回对象的字典对象，通常是服务器发送的特定的头。import urllib.requesturl="https://www.baidu.com"respose=urllib.request.urlopen(url)html_doc=respose.read().decode("utf-8")print(respose.info())运行结果：C:\Users\Administ...

python web 开发中url 的分类

onlyyou624的博客

04-26

308

1，静态url 每个网页有真实的物理路径，也就是真实存在于服务器里的。 http://127.0.0.1:7890/index.html 在服务器的磁盘中，存在一个index.html文件，这个url所展示的就是这个文件的内容，没有做任何的变化 2，动态url 带有？的url，我们一般称为动态网址。它只是一个逻辑地址，不是真实物理存在于服务器硬盘的。 SEO...

python urlopen()

Dou

05-19

4775

首先调用urlopen需要导入urllib.request模块。 urllib.request : urlopen() : 简单来说就是打开一个URL. url : 来自百度百科 urlopen的返回值，测试：可见返回值是http.client.HTTPResponsed对象。 http.client.HTTPResponsed对象：详...

Python urlopen()函数示例分享

12-24

复制代码代码如下:from urllib import urlopendoc = urlopen(“http://www.baidu.com”).read()print doc 二、获取Http头复制代码代码如下:from urllib import urlopendoc = urlopen(“http://www.baidu.com”)...

Python web应用程序开发实验项目

最新发布

11-16

2. **Python Web客户端**： - `web_client.py`代表Web客户端，通常指的是浏览器，但在这个项目中，它可能是一个简单的命令行工具，用于发送HTTP请求到Web服务器。 - Python的`urllib.request`库可以用于模拟HTTP...

Python urlopen 使用小示例

12-23

Python的`urlopen`函数是`urllib`模块的一部分，用于打开和读取网络资源，如网页、API接口等。这个功能强大的工具是Python进行网络编程的基础，特别在爬虫和自动化任务中不可或缺。让我们详细了解一下`urlopen`的...

Python urlopen()和urlretrieve()用法解析

09-18

主要介绍了Python urlopen()和urlretrieve()用法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Python使用urllib2模块抓取HTML页面资源的实例分享

09-21

在Python编程中，`urllib2`模块是用于处理URL（统一资源定位符）的工具包，特别适合于从Web上抓取数据。本实例主要介绍如何使用`urllib2`来抓取HTML页面资源，并将要抓取的网页地址存储在列表中，以便于管理和重用。...

Python 通过URL打开图片的几种方式

熊大的博客

10-23

5216

https://blog.csdn.net/brave_sun/article/details/76407200

python中url格式是什么_python对url格式解析的方法

weixin_34049581的博客

02-03

1041

本文实例讲述了python对url格式解析的方法。分享给大家供大家参考。具体分析如下：python针对url格式的解析，可根据指定的完整URL解析出url地址的各个部分from urlparse import urlparseurl_str = "http://www.163.com/mail/index.htm"url = urlparse(url_str)print 'protocol:',u...

python函数学习--函数的四种返回值形式

郑小小小小源的博客

06-19

9248

python中函数返回常用一下四种类型， def test1(): print("in the test1")#无返回值 def test2(): print("in the test2")#返回0 return 0 def test3(): print("in the test3")#返回参数 return 'test3' def test4():

如何通过URL打开图片(Python)

热门推荐

星沉阁

05-08

4万+

不论是用opencv还是PIL，skimage等库，在之前做图像处理的时候，几乎都是读取本地的图片。最近尝试爬虫爬取图片，在保存之前，我希望能先快速浏览一遍图片，然后有选择性的保存。这里就需要从url读取图片了。查了很多资料，发现有这么几种方法，这里做个记录。本文用到的图片URL如下：img_src = 'http://wx2.sinaimg.cn/mw690/ac38503ely1fesz8m0o

urllib.request模块学习(一)----urlopen()函数与Request类详解

ckk727的博客

10-06

3919

urllib模块提供了一系列用于操作URL的功能。 urllib Python3之后，urllib与urllib2模块合并为了一个模块，即urllib模块，因此处理URL时用一个urllib模块即可满足基本所需功能，Python3中还有一个拓展的urllib3模块，仅作了解。 urllib可以被看作一个包，它由四个模块组成，分别为： urllib.request ：最基本的http请求模...

关于urllib2.urlopen()的理解

Jamie Jiang's Blog

07-19

5204

第一次使用Markdown编辑器作为 python 的入门人员，对最近学习的网页下载器有很多小疑问，在这里记录一下，都是我自己查资料逛网站的理解，欢迎指正！首先说一下： urllib2 是什么？urllib2 是 python 官方提供的一个获取url（Uniform Resource Locators，统一资源定址器）基础模块。 urlopen()是什么？urlopen是一个函数形式的接口，用来

urlopen关于超时timeout问题的解释

xuke100的博客

05-09

8554

python（3.5）中的 try: page = urllib.request.urlopen(url_sum, timeout=10.0)except: print('error') 表示一次http访问请求的时间最多10秒，一旦超过，本次请求中断，但是不进入下一条，而是继续重复请求这一条。上面的代码若超时会出现以下现象： . . . http://dis

python urlopen

10-08

urlopen是Python中urllib.request模块中的一个函数，它用于打开URL并返回一个类似文件的对象。可以使用这个对象的方法来读取URL的内容。通过urlopen函数可以实现HTTP请求的构造，处理授权验证、重定向、浏览器...