#异常处理
import urllib.error #导入异常处理库
import urllib.request
try:
urllib.request.urlopen("网址")
except urllib.error.URLError as e: #处理
if hasattr(e,"code"): #urlerror 的状态码时有时无故需要判断
print(e.code)
if hasattr(e,"reason"):
print(e.reason)
#浏览器伪装
#网页源代码Internet中的headers(报头)中的useragent会判断你是人还是爬虫
import urllib.request
url=""
headers=("User-Agent","复制") #伪装报表
opener=urllib.request.build_opener() #创建新报头
opener.add_headers=[headers] #添加
data=opener.open(url).read()
fh=open("网页","wb") #二进制方式写入
#4、异常处理
最新推荐文章于 2021-01-26 00:09:10 发布