爬虫通用爬取框架——try-except的运用

最新推荐文章于 2023-11-22 14:33:01 发布

qqwowo99

最新推荐文章于 2023-11-22 14:33:01 发布

阅读量951

点赞数

本文链接：https://blog.csdn.net/qqwowo99/article/details/107685487

版权

爬虫通用爬取框架——try-except的运用
这里可以显示错误的情况

def getHTMLText(url):
	try:
		r = requests.get(url, timeout = 30)
		r.raise_for_status()
		r.encoding = r.apparent_encoding
		return r.text
	 except Exception as e:
        print (e)

这个代码中我们用r.raise_for_status()方法，它能够判断返回的Response类型状态是不是200。如果是200，他将表示返回的内容是正确的，如果不是200，他就会产生一个HttpError的异常。如果网连接出现错误，那么它就会用try-except来获取一个异常。

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qqwowo99

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫——异常处理(try/except/else/finally)

Simon_LHM的博客

08-10

1985

1. 什么是异常当程序运行中检测到一个错误时，无法继续执行，出现了一些错误的提示，这就是异常常见错误类型 BaseException 所有异常的基类 *** SystemExit 解释器请求退出 *** KeyboardInterrupt 用户终端执行(通常是输入) *** GeneratorExit 生成器(Generator)发生异常来通知推出 *** Exception 常规错误基类 2. 异常捕获 python中的异常捕获...

爬虫教程（ 6 ） --- 爬虫进阶、扩展

墨鱼菜鸡

07-11

6864

1. 前言 1. 先看一个最简单的爬虫。 import requests url = "http://www.cricode.com" r = requests.get(url) print(r.text) 2. 一个正常的爬虫程序上面那个最简单的爬虫，是一个不完整的残疾的爬虫。因为爬虫程序通常需要做的事情如下： 1)给定的种子 URLs，...

参与评论您还未登录，请先登录后发表或查看评论

python写爬虫时需要捕获出错信息: try except模块

xtreallydance的博客

12-29

1419

如果你肯花时间来了解我，你就会发现，你浪费了一点时间！今天晚上写爬虫代码时候，需要了解出错信息，然后就自己调试了以下代码，最终找到了出错原因，然后呢直接贴代码讲吧！ try: # //*[@id="J-items-content"]/div[5]/div/div[1]/div[2]/div[1]/div[1] # years = item.xpath('//*[@id="J-items-content"]/div[4]/di.

用try方法提高爬虫的效率

xiezhiming1234的博客

10-31

2271

网络爬虫经常会碰到各种异常，原因多种多样，当发现错误时，再来修改代码，再重新运行，需要时间，这不利于爬虫的效率。我们可以通过try来避免异常。代码如下： URL = 'http://www.bj.xiaozhu.com/' res = requests.get(url=URL) try: print(res.text) except ConnectionError: print(...

【python爬虫专项（3）】网络资源获取工具requests库介绍（try-except错误异常处理）

lys_828的博客

02-06

3518

1、requests介绍 1.1 什么是requests？ ● 用于访问网页（url）的工具包 1.2 如何安装？ ● 首先检查自己有没有requests：pip show &nbsp...

Python基础（6）爬虫requests库

xiaoyaoyige的博客

06-10

261

文章目录Requests库的安装测试Requests库的使用方法requests.get()Response对象Response对象的属性操作例子Requests库异常爬取网页的通用代码框架try-except 语句代码框架 Requests库的安装 cmd -> pip install requests -> python -m pip install -upgrade pip 测试...

爬虫：Ajax数据爬取

二十四桥明月夜

01-03

8871

目录 1、什么是Ajax 1.1 实例的引入 1.2 基本原理 2、Ajax分析方法 1、查看请求 2、过滤请求 3、Ajax结果提取 1、分析请求 2、分析响应 3、例子我们在用 requests 抓取页面的时候，得到的结果可能和在浏览器中看到的不一样：在浏览器中可以看到正常显示的页面数据，但是使用 requests 得到的结果并没有，这是因为 requests 获取的都是原始的 HTML 文档，而浏览器中的页面则是经过 JavaScript 处理数据后生成的结果，这些数据的.

python爬虫阶段性总结和项目实操——爬取猫眼票房Top100

太子悦神的博客

08-09

1591

本博客通过爬取猫眼票房Top100来简要复习一下网页的HTML获取（requests库）解析（Beautiful Soup库）和数据保存（csv库）以及总结一下爬取过程中遇到的问题和解决方法运行结果如下 1.获取网页源代码 def get_one_page(url): headers={ 'User-Agent':'your_UA', 'Cookie':'your_cookie' } try:

python爬虫自学习1+京东商品爬取实例

weixin_51396863的博客

11-19

1万+

自学习笔记序安装第三方库序最近突然觉得有必要学一下python，翻开大一的Python书发现忘的那是一干二净，想学一下爬虫，只好重头再来，找了个教程一看啥都看不懂，还是老老实实从零开始吧。安装第三方库爬虫有一个库叫 requests 说出来不怕丢人我好像连安装第三方库都不会，算了一步一步来打开 cmd ，因为我的Python是装在D盘的，哪怕以前学过，我还是忘得一干二净按照图片操作即可得到想安装的第三方库 ...

Python网络爬虫与信息提取——requests库

Daisy_fight的博客

09-12

524

这是北京理工大学的课程，附上视频link：https://www.bilibili.com/video/av9784617/?p=1 Requests库 Requests库主要方法 Requests库的7个主要方法方法说明 requests.request() 构造一个请求，支撑以下各方法的基础方法 requests.get() 获取HTML网页的主要...

python自定义多线程爬虫例子，3dmax学习资料，在爬虫中使用try，避免运行不了

m0_55234643的博客

01-18

411

这个是不用多线程，可以看看他是卡，卡在了哪里，为什么会卡半天 def dmax(): import requests, re,threading from bs4 import BeautifulSoup from threading import Thread url='http://www.3dmax8.com/3dmax/peixun/3dmax2020/' #url = 'http://www.3dmax8.com/3dmax/peixun/3dma

qq_17495489的博客

08-30

324

一、异常 1.什么是异常程序在执行的过程因为遇到错误的语法导致程序奔溃 2.什么是异常捕获通过异常捕获的程序，让本省异常的代码能够继续执行 3.怎么捕获异常语法一： try：代码段1 except: 代码端2 说明： try、except - 关键字，固定写法代码段1 - 需要捕获异常的代码端代码段2 - 捕获到异常后会执行的代码执行过程：先执行代码段1，如果执行过程中出现了异常，程序不崩溃，直接执行代码段2，然后接着执行后续其他语句 try:

try....except的用法

最新发布

Ling_Ze的博客

11-22

134

try....except的用法

try/except介绍

weixin_44416136的博客

03-14

2万+

try/except介绍与其他语言相同，在python中，try/except语句主要是用于处理程序正常执行过程中出现的一些异常情况，如语法错（python作为脚本语言没有编译的环节，在执行过程中对语法进行检测，出错后发出异常消息）、数据除零错误、从未定义的变量上取值等；而try/finally语句则主要用于在无论是否发生异常情况，都需要执行一些清理工作的场合，如在通信过程中，无论通信是否发生错...

01-try-except异常处理

qq_46857088的博客

04-08

1万+

大家好，我是Python领域的博主，如果觉得我的写的不错的话，请点赞关注支持我一下。如果你是初学者，可以和小编一起学习，在这里我每天都会发Python的基础知识，以及相关的代码关注我，和我一起学习吧文章目录一、try-except是什么？二、使用步骤 1.用法讲解 2.案例讲解小编畅谈一、try-except是什么？它是Python中最主要的异常类型，它表明发生异常的原因，也是程序处理异常的依据二、使用...

try-except语句的应用(超详细的学习笔记)

不吃辣的IT男

06-13

3万+

一、前言看下面小程序： num=eval(input("请输入一个数：")) print(num**2) 结果：请输入一个数：2 4 如果我们输入的不是数会发生什么结果：请输入一个数：no Traceback (most recent call last): File "C:\Users\我的电脑\AppData\Local\Programs\Python\Python35-32\样本.py", line 1, in <module> num=eval(input("请输入一

python中try/except异常处理

weixin_69277445的博客

04-18

540

需要注意的是，当使用try/except语句时，我们应该尽可能地指定要捕获的异常类型。如果我们只是简单地写一个except语句，它会捕获所有类型的异常，这可能会导致一些潜在的问题。我们通过在try块中包含这个代码，并在except块中处理这个异常，来避免程序崩溃。总之，try/except语句是Python中一个非常有用的机制，可以帮助我们处理异常并避免程序崩溃。在编写代码时，我们应该始终考虑到可能出现的异常，并使用try/except语句来捕获和处理它们。# 执行可能会出现异常的代码。

python中try/except用法简介

m0_57236802的博客

01-13

6264

用于检测程序中的异常。try子句中的代码被执行，如果没有异常发生，则不执行except子句。如果在try子句中发生了异常，则跳过try子句中剩余的代码，然后执行一个或多个except子句，最后执行finally子句。上面的程序中，在try子句中执行了1 / 0，这会导致一个ZeroDivisionError异常。由于这个异常是被except子句所捕获的，因此不会中断程序执行，而是执行except子句中的代码。最后finally子句中的代码也会被执行。

python中try怎么用_Python中try语句的用法