python爬取文件后写入到本地，报编码错误问题

最新推荐文章于 2023-11-22 11:23:19 发布

王的剑鞘&wkq

最新推荐文章于 2023-11-22 11:23:19 发布

阅读量699

点赞数

文章标签： python 爬虫

本文链接：https://blog.csdn.net/wkq_1212/article/details/80553732

版权

爬虫新手，初次尝试爬虫，发现爬取后写入本地出错，错误大概意思就是编码不对。

首先这个并不是当前文件编码的锅，也就是第一行声明的，怎么改也不会有用的，其原因是windows下新建文件默认是gbk模式的，然后我们刚刚爬取的格式并不是gbk，所以导致写入出错，对此我们只需打开文件时声明编码格式即可

#coding=gbk
from urllib import request
req = request.Request('http://www.douban.com/')
with request.urlopen(req) as f:
	print('status：',f.status, f.reason)
	for k,v in f.getheaders():
		print('%s:%s' % (k,v))
	html = f.read().decode('utf-8')
	with open('./test.txt', 'w',encoding='utf-8') as ff:
		ff.write(html)

其中倒数第二行用encoding='utf-8'声明了编码格式，这样就跟我们要写入的一致了，也就不会报错了。

王的剑鞘&wkq

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬取文件后写入到本地，报编码错误问题

爬虫新手，初次尝试爬虫，发现爬取后写入本地出错，错误大概意思就是编码不对。首先这个并不是当前文件编码的锅，也就是第一行声明的，怎么改也不会有用的，其原因是windows下新建文件默认是gbk模式的，然后我们刚刚爬取的格式并不是gbk，所以导致写入出错，对此我们只需打开文件时声明编码格式即可#coding=gbkfrom urllib import requestreq = request.Re...
复制链接

扫一扫