Python 中文编码

本文介绍了Python在处理中文字符时可能出现的编码问题,当Python文件未指定编码时,使用ASCII格式会导致无法正确显示汉字。解决方法是在文件开头添加 '# -*- coding: utf-8 -*-' 或者 'unicode_literals'。在Python3中,源码默认使用utf-8编码,通常能正常处理中文。此外,确保编辑器如PyCharm的文件编码设置为UTF-8也是关键,否则会遇到错误信息。
摘要由CSDN通过智能技术生成

Python 中文编码

前面章节中我们已经学会了如何用 Python 输出 “Hello, World!”,英文没有问题,但是如果你输出中文字符 “你好,世界” 就有可能会碰到中文编码问题。

Python 文件中如果未指定编码,在执行过程会出现报错:

#!/usr/bin/python
print ("你好,世界")

以上程序执行输出结果为:
File "test.py", line 2 SyntaxError: Non-ASCII character '\xe4' in file test.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。
解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 # coding=utf-8 就行了

注意:# coding=utf-8 的 = 号两边不要空格。

#!/usr/bin/python
#-*- coding: UTF-8 -*-

print( "你好,世界" )

输出结果为:
你好,世界

注意:Python3.X 源码文件默认使用utf-8编码,所以可以正常解析中文,无需指定 UTF-8 编码。
注意:如果你使用编辑器,同时需要设置 py 文件存储的格式为 UTF-8,否则会出现类似以下错误信
息:

SyntaxError: (unicode error) ‘utf-8’ codec can’t decode byte 0xc4 in position 0:
invalid continuation byte

Pycharm 设置步骤:

  1. 进入 file > Settings,在输入框搜索 encoding。
  2. 找到 Editor > File encodings,将 IDE Encoding 和 Project Encoding 设置为utf-8。
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值