python学习urllib（一）

最新推荐文章于 2020-12-01 01:19:56 发布

自给自足财富自由

最新推荐文章于 2020-12-01 01:19:56 发布

阅读量146

点赞数

本文链接：https://blog.csdn.net/weixin_39892788/article/details/89848214

版权

urlretrieve() 保存HTML文件

import re
import urllib.request
url=urllib.request.urlretrieve('https://www.csdn.net/',filename='f:/pytest/unit/url.html')
print (url）

urlcleanup() 清除缓存

urllib.request.urlcleanup()

info() 获取网页环境信息

import re
import urllib.request
url=urllib.request.urlopen('https://www.csdn.net/')
f=url.info()
print(f)

getcoude() 获取网页状态码（返回200，网页正常；返回403说明禁止访问）
geturl() 获取当前网页网址

timeout 超时设置

import re
import urllib.request

for i in range(1,20):
  try:
    url=urllib.request.urlopen('https://www.csdn.net/',timeout=1).read()
    print(len(url))
    
  except Exception as e:
    print('出现异常：'+str(e))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

自给自足财富自由

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python导入urllib request_Python爬虫学习笔记（一）——urllib库的使用

weixin_30395941的博客

01-29

1445

前言我买了崔庆才的《Python3网络爬虫开发实战》，趁着短学期，准备系统地学习下网络爬虫。在学习这本书的同时，通过博客摘录并总结知识点，同时也督促自己每日学习。本书第一章是开发环境的配置，介绍了爬虫相关的各种库以及如何安装，这里就跳过了。第二章是爬虫基础，都是些基本知识点，也跳过。从第三章开始认真记录学习路径。urllib库的使用urllib库是python内置的HTTP请求库，包含四个模块，接...

Python3学习笔记（urllib模块的使用）转http://www.cnblogs.com/Lands-ljk/p/5447127.html

weixin_30244681的博客

05-19

132

Python3学习笔记（urllib模块的使用） 1.基本方法 urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None) -url: 需要打开的网址 -data：Post提交的数...

参与评论您还未登录，请先登录后发表或查看评论

python urllib学习

qq_41983562的博客

11-17

852

·什么是urllib： Python内置的html请求库（不需要安装的库） urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.tobotparse robot.txt解析模块 python2的变化： python2: import urllib2 response =urllib.urlope...

python库——urllib学习

C_Creator的博客

08-25

455

参考文献：https://docs.python.org/3/library/urllib.htmlurllib的学习: 1.urllib.request:打开或读取url 2.urllib.error:urllib抛出的异常 3.urllib.parse:解析urls 4.urllib.robotparser:解析robots.txt文件一、urllib.reque

python3 urllib学习

weixin_34161029的博客

09-28

urllib 是Python内置的HTTP请求库 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser robots.txt解析模块 urllib.request请求模块 request.urlopen() 常用参数： url data:如果有变成po...

Python3 Urllib学习

Jerry_ICCAS的博客

01-07

752

urllib 的四个模块 1 . urllib.request 2. urllib.error 3. urllib.parser 4. urllib.robotparser import urllib.request response = urllib.request(“http://yaopu.github.io“) /#得到的是一个对象，response type(resp

Python爬虫 urllib2的使用方法详解

01-20

在Python中有很多库可以用来抓取网页，我们先学习urllib2。 urllib2是Python2.x自带的模块(不需要下载，导入即可使用) urllib2官网文档：https://docs.python.org/2/library/urllib2.html urllib2源码 urllib2在...

Python3学习urllib的使用方法示例

01-21

urllib是python的一个获取url(Uniform Resource Locators,统一资源定址符)了，可以利用它来抓取远程的数据进行保存，本文整理了一些关于urllib使用中的一些关于header,代理,超时,认证,异常处理处理方法。 1.基本方法...

解决python3 urllib中urlopen报错的问题

09-21

根据官方文档，Python3引入了一个新的`urllib`包，该包包含了来自`urllib`, `urllib2`, `urlparse`, 和 `robotparser`等模块的功能。旧模块已被移除，并替换为以下五个子模块： - `urllib.parse` - `urllib.request...

python边写边总结（七）urllib学习

zhouzhouasishuijiao的博客

12-15

180

今天偶然碰到爬虫，之前也了解正则表达式，哈哈哈，就试着操作了一下，但是对于urllib了解不够，今天就总结一下，以后可能用得着 HTTP和HTTPS HTTP即超文本传输协议，用于在Web浏览器和网站服务器之间传递信息，HTTP协议以明文方式发送内容，不提供任何方式的数据加密，如果攻击者截取了Web浏览器和网站服务器之间的传输报文，就可以直接读懂其中的信息，因此，HTTP协议不适合传输一些敏感信...

python3爬虫学习笔记（一）初入爬虫 urllib学习

qq_40306845的博客

07-22

1612

一、爬虫是什么网络爬虫（也叫做网页蜘蛛），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。如果把互联网比做成一个大的蜘蛛网，蜘蛛网上每个节点都有大量的数据，爬虫就像一只小蜘蛛通过网页的地址找到网站并获取信息：HTML代码/JSON数据/二进制数据（图片、视频）。二、URL--有了地址爬虫才知道去哪里爬浏览器对应的地址就是URL，例如https://www.baidu.com/...

Python爬虫1.1 — urllib基础用法教程

让编程改变世界

08-03

2414

Python爬虫 — urllib基础用法教程综述urllib库介绍urllib.request 介绍urlopen()urlretrleve()urllib.parse 介绍urlencode()parse_s()urlparse()urlsplit()urljoin()urllib.error 介绍综述本系列文档用于对Python爬虫技术进行简单的讲解记录，巩固自己技术知识的同时，万一一不...

python url_python Url模块

weixin_39860919的博客

12-01

113

一。该模块的用途：1。从制定的URL获取数据2。对URL字符串进行格式化处理二。__version__='1.17'的urllib模块中的主要函数和类介绍：1。函数：(1)def urlopen(url, data=None, proxies=None)参数说明：url 符合URL规范的字符串(包括http,ftp,gopher,local-file标准)d...

python-快速使用urllib爬取网页（1）

沐雨金鳞

12-23

5403

要使用Urllib爬取网页，首先需要导入用到的对应模块 urllib是python自带的模块,不需要下载import urllib.request导入了模块后，我们采用以下方法打开并爬取一个网页file = urllib.request.urlopen("http://www.baidu.com")此时，我们已经将爬取到的网页赋给了变量file 爬取完后，我们现在可以使用file.read（）读

初识Python,画太阳黑子图

爱测乐园

11-09

2105

准备工具：python2.7对应下载：http://www.reportlab.com/ftp/reportlab-2.7.win32-py2.7.exe 代码实现： from urllib import urlopen from reportlab.lib import colors from reportlab.graphics.shapes import * from re

绘制太阳黑子图

no_cross_no_crown的专栏

03-21

1608

数据来源：http://www.swpc.noaa.gov/ftpdir/weekly/Predict.txt代码：sunspots.pyfrom urllib import urlopen from reportlab.lib import colors from reportlab.graphics.shapes import * from reportlab.graphics.charts.lineplots import LinePlot from reportlab.graphics.ch

Python 练习之画幅好画

dongli_816的博客

03-21

603

《python基础教程》画幅好画使用reportlab模块画出太阳黑子的曲线图。源代码：from reportlab.lib import colors from urllib import urlopen from reportlab.graphics.shapes import * from reportlab.graphics.charts.lineplots import Lin...

使用ReportLab绘制PDF

Magician Blog

01-09

6421

使用ReportLab绘制PDF 1. ReportLab 简介这是一个软件库，可让您使用Python编程语言以Adobe的可移植文档格式（PDF）直接创建文档。它还以各种位图和矢量格式以及PDF创建图表和数据图形。Wikipedia,hp都在使用。 2. ReportLab功能绘制图形(直线,圆,自定义图形) 自定义文字和编码(主要是英文,对中文不太友好) PDF页面框架布局自定义和模板定...

#python基础教程太阳黑子图形程序的第一个原型

hellodrawing的博客

02-24

1276

#!/usr/bin/env python # -*- coding: utf-8 -*- #python基础教程太阳黑子图形程序的第一个原型(sunspots_roto.py) from reportlab.lib import colors from reportlab.graphics.shapes import * from reportlab.graphics

Python学习：datetime与urllib模块详解