【python】中文的输出,打印,文件编码问题解决方法

直接在python中输入中文的字符串会报编译错误SyntaxError: Non-ASCII character,因为python文件默认编码方式是ASCII。如果想要打印中文字符,有两种方式:

1.在文件第一行加入# -*- coding: UTF-8 –*-,修改文件的默认编码方式。然后直接在python 文件编辑中文字符串即可,例如:string = “中文”

2. 将需要打印的中文字符转化成unicode编码并且加上u,例如要打印“我们”,则写成u“\u6211\u4eec”

 

print u'\u6211\u662f'

 3. 如果遇到 类似UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0错误,因为在定义中文字符串变量时候,没有加上u,例如:string = “中文”而不是string = u“中文”,

这个时候python会把按照默认的中文字符串用ASCII进行编码,则可能会出现一些错误,要想吧类似string = “中文”的字符串用utf8编码,在文件前面加上如下代码即可:

 1 import sys 2 reload(sys) 3 sys.setdefaultencoding('utf8') 

 

4.字符串前面加了U之后会变成unicode类型,这时候是python独立的一种类型,如果直接写入字符类型的数据库字段或者当成字符串进行操作,可能会遇到意想不到的错误。

5. 如何吧一个 string = '\u5168\u56fd'变成 unicode类型?

用eval("u"+"'\u5168\u56fd'")方法即可

6. scrapy网络爬虫中文乱码问题解决

(1)判断抓取网页字符编码格式

import chardet
code_format = chardet.detect(response.body)["encoding"]

(2)根据获取的编码方式进行解码,然后采用系统默认方式编码

import sys
type = sys.getfilesystemencoding()
response.body.decode(code_format).encode(type)

 

 

转载于:https://www.cnblogs.com/xiaoqu/p/3540506.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值