python怎么检查urllib_Python 爬虫入门（一）urllib的基本使用

weixin_39989668

于 2020-12-24 15:54:25 发布

阅读量93

点赞数

文章标签： python怎么检查urllib

本文链接：https://blog.csdn.net/weixin_39989668/article/details/111969536

版权

前言：

urllib包含四个模块:

urllib.request可以用来发送request和获取request的结果

urllib.error包含了urllib.request产生的异常

urllib.parse用来解析和处理URL

urllib.robotparse用来解析页面的robots.txt文件

1. urllib.request的基本使用方法属性

1.1. 使用urllib.request.urlopen()来爬取网页

In [1]: import urllib.request

In [2]: r=urllib.request.urlopen('http://blog.fishc.com/3597.html')

In [3]: r.read().decode('utf-8')

Out[3]: '\n

\n\n论一只爬虫的自我修养2：实战 – 零基础入门学习Python054 | 鱼C工作室\n\n\n

# True

# False

以上简单介绍urllib的简单用法，下面给出一个实战例子，交互式有道翻译请求：

import urllib.request

import urllib.parse

import json

url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=https://www.google.com.hk/'

data=dict()

data['type']='AUTO'

data['i']=input("Plz input what you want to translate: ")

data['doctype']='json'

data['xmlVersion']='1.8'

data['keyfrom']='fanyi.web'

data['ue']='UTF-8'

data['action']='FY_BY_CLICKBUTTON'

data['typoResult']='true'

data=urllib.parse.urlencode(data).encode('utf-8')

# 必须对data进行转码

response=urllib.request.urlopen(url,data)

html=response.read().decode('utf-8')

target=json.loads(html)

print('翻译结果：',target['translateResult'][0][0]['tgt'])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39989668

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python导入urllib request_Python爬虫学习笔记（一）——urllib库的使用

weixin_30395941的博客

01-29

1457

前言我买了崔庆才的《Python3网络爬虫开发实战》，趁着短学期，准备系统地学习下网络爬虫。在学习这本书的同时，通过博客摘录并总结知识点，同时也督促自己每日学习。本书第一章是开发环境的配置，介绍了爬虫相关的各种库以及如何安装，这里就跳过了。第二章是爬虫基础，都是些基本知识点，也跳过。从第三章开始认真记录学习路径。urllib库的使用urllib库是python内置的HTTP请求库，包含四个模块，接...

使用Python的urllib和urllib2模块制作爬虫的实例教程

09-21

### 使用Python的urllib和urllib2模块制作爬虫的实例教程 #### 一、概述本文档将详细介绍如何利用Python中的`urllib`及`urllib2`两个模块来进行网页爬取工作，并通过实际案例展示如何抓取网页内容与图片资源。此...

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫--urllib库

JonSnow

07-08

278

1. url介绍在Python2中，有urllib和urllib2两个库来实现发送请求的功能，但是在Python3中统一到urllib这个库里面。官方链接：urllib 主要模块： request：最基本的HTTP请求模块，可以模拟像浏览器一样在地址栏输入url地址后发送请求这个过程，只需要给库方法里传入url参数以及其他额外参数即可 parse：用来处理url的模块，可以实现url的拆分、合并、解析等 error：异常处理模块 robotparser：主要用来识别网站上robots.

python实现简单爬虫百度首页_用Python实现一个简单的爬虫

weixin_40005437的博客

11-24

422

Urllib 库的基本使用分分钟扒一个网页下来怎样扒网页呢？其实就是根据URL来获取它的网页信息，虽然我们在浏览器中看到的是一幅幅优美的画面，但是其实是由浏览器解释才呈现出来的，实质它是一段 HTML 代码，加 JS、CSS，如果把网页比作一个人，那么 HTML 便是他的骨架，JS 便是他的肌肉，CSS 便是它的衣服。所以最重要的部分是存在于 HTML 中的，下面我们就写个例子来扒一个网页下来。i...

Python urllib实用方法、属性、流程总结

trayvontang的博客

11-26

445

目录一、urllib、urllib2、urllib3、requests二、urlopen三、Response四、Request五、异常六、urllib handler处理流程七、cookie7.1 获取cookie7.2 cookie保存与重用7.3 服务端代码八、代理九、Auth十、总结一、urllib、urllib2、urllib3、requests urllib2室python2中的，py...

python中库的安装，查看

sfakh的博客

07-05

1857

本文目录安装库利用命令框安装python库如何查看某个库是否安装直接在程序里面import 库名在Anaconda里面查看已安装的库查看库的详细用法在运行环境里面查看在官方网站查看在用Python时候，一般都是 Anaconda + Pycharm 搭配使用，这是因为Anaconda 是一个基于 Python 的数据处理和科学计算平台，它已经内置了许多非常有用的第三方库，装上Anaconda，就相当于把 Python 和一些 OpenCV、Numpy、Pandas、Scrip、Matplotlib 等常用

python中查看已安装三方库的版本号

MissOfSpring的博客

12-14

5633

有时候需要对已经安装的第三方库查看一下版本号，本文记录如下内容： python的版本号三方库的版本号文中的操作是在cmd中进行的操作，当然也可以在其它的控制台中进行。 1. python的版本号使用命令： python就可 C:\Users\Administrator>python Python 3.8.2 (tags/v3.8.2:7b3ab59, Feb 25 2020, 22:45:29) [MSC v.1916 32 bit (Intel)] on win32 Type "help"

Python 网络爬虫开发 Python爬虫入门基础教程：Python的urllib2 模块解析共6页.pptx

06-18

Python 网络爬虫开发基础教程：Python 的 urllib2 模块解析 Python 网络爬虫开发是指使用 Python 语言来开发网络爬虫程序，以便从互联网上抓取有价值的数据。Python 的 urllib2 模块是 Python 的一个标准库，提供了...

lesson7-爬虫入门.rar_python 爬虫_thisn6q_爬虫入门

09-20

这个"lesson7-爬虫入门"教程可能涵盖了以上部分或全部知识点，旨在帮助初学者建立起对Python爬虫的基本认识，并逐步熟悉爬虫的实现过程。通过学习，你可以构建简单的爬虫项目，从网页中抓取数据并进行初步的分析。...

python3版本中的urllib

weixin_39885687的博客

11-26

2496

urllib是python的一个获取url(Uniform Resource Locators,统一资源定址器)了，我们可以利用它来抓取远程的数据进行保存！ ·需要注意的是：在python2版本中，有urllib2,urllib3，但是在python3中，将这两个综合成了一个urllib 同时，还有几种函数调用需要注意：在python2中，使用urllib2请求获取url抓取网

Java web的笔记

m0_46937429的博客

10-27

326

1.web开发模型的2种模式，我们使用的是哪一种其优缺点是什么？ b/s c/s b/s优点：成本低，客户端零维护，安全性高缺点：负载重，分布式应用，宽带带宽 2.http是什么其作用和特点各是什么？ http：超文本传输协议基于请求和响应的无状态传输状态 3.servlet的执行流程？ action→xml中的url→name→name→class→get或post 三层体系数据层存储大量的数据信息和数据逻辑，完成与数据有关的安全，完整性控制，数据的一致性，并发操作中间层所有的应用系统，应用逻

python如何查看urllib库_Python中urllib库使用cookie方法

weixin_35810956的博客

12-24

257

使用urllib库请求网站时，需要用开启cookie的方法。这边的cookie开启需要使用http.cookiejar，通过cookieJar()类构建一个cookieJar()对象，用来保存cookie的值一、这边利用登录人人网举例说明import urllib.parseimport urllib.requestfrom http import cookiejarcookie = cookie...

Python3之urllib库的使用总结

qq_27009517的博客

09-28

448

Urllib库是Python中的一个功能强大、用于操作URL，并在做爬虫的时候经常要用到的库。在Python2.x中，分为Urllib库和Urllib2库，Python3.x之后都合并到Urllib库中，使用方法稍有不同。本文介绍的是Python3中的urllib库。什么是Urllib库 Urllib是Python提供的一个用于操作URL的模块，我们爬取网页的时候，经常需要用到这个库。升级合并后，模块中的包的位置变化的地方较多。在此，列举一些常见的位置变动，方便之前用Python2.x的朋友...

如何查看Python 安装位置以及已经安装的库

最新发布

10-13

这是pjython中最重要的一个插件，所以我们要先下载到csdn中

fastcache-1.1.0-cp38-cp38-win_amd64.whl

10-13

fastcache-1.1.0-cp38-cp38-win_amd64.whl

【图像检索】基于matlab颜色特征图像检索（含直方图距离）【含Matlab源码 4145期】.md

10-13

CSDN Matlab武动乾坤上传的资料均有对应的代码，代码均可运行，亲测可用，适合小白； 1、代码压缩包内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主或扫描博客文章底部QQ名片； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作 KNN图像检索、Hu不变矩图像检索、综合颜色和形状特征图像检索

【图像加密】基于matlab混沌结合小波变换图像加密【含Matlab源码 3223期】.md

10-13

CSDN Matlab武动乾坤上传的资料均有对应的代码，代码均可运行，亲测可用，适合小白； 1、代码压缩包内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主或扫描博客文章底部QQ名片； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作图像加密： DNA混沌图像加密、Arnold置乱图像加密解密、Logistic+Tent+Kent+Hent图像加密与解密、双随机相位编码光学图像加密解密正交拉丁方置乱图像加密解密、RSA图像加密解密、小波变换DWT图像加密解密、混沌结合小波变换图像加密

Python爬虫入门：urllib库详解与使用

本文主要介绍了Python爬虫的基础知识，特别是如何使用内置库urllib进行HTTP请求。urllib库包括request、error、parse和robotparser四个模块，分别用于HTTP请求、异常处理、URL处理和robots.txt解析。文章着重讲解了...