scrapy爬取的数据进行存储时，中文为unicode

最新推荐文章于 2021-08-04 12:33:23 发布

望穿秋水的zephyr

最新推荐文章于 2021-08-04 12:33:23 发布

阅读量303

点赞数

分类专栏： scrapy汉字unicode scrapy汉字编码问题 python 文章标签： python unicode

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44400550/article/details/116601155

版权

scrapy汉字unicode 同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

scrapy汉字编码问题

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

学习scrapy存储文件时，在爬虫文件将自己的数据写为dict，之后在pipelines.py中转化为json，之后写入文件时发现文件中的汉字为unicode编码，在网上找了找解决办法，说是在settings.py中添加`FEED_EXPORT_ENCODING = 'utf-8'` 这一行代码，照做之后发现无效。

然后又找了找，发现了很简单的解决办法：在pipelines.py文件中转为json时，添加`ensure_ascii=False` 这一参数即可。

ensure_ascii=True：默认输出ASCLL码，如果把这个该成False,就可以输出中文。

def process_item(self, item, spider):
	    item = json.dumps(item,ensure_ascii=False)
	    self.qsbk_file.write(item+'\n')

望穿秋水的zephyr

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
scrapy爬取的数据进行存储时，中文为unicode

学习scrapy存储文件时，在爬虫文件将自己的数据写为dict，之后在pipelines.py中转化为json，之后写入文件时发现文件中的汉字为unicode编码，在网上找了找解决办法，说是在settings.py中添加FEED_EXPORT_ENCODING = 'utf-8' 这一行代码，照做之后发现无效。于是，又查了查，发现了很简单的解决办法：在pipelines.py文件中转为json时，添加ensure_ascii=False 这一参数即可。def process_item(self, ite
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。