学习笔记1：正确输出中文-CSDN博客

本文链接：https://blog.csdn.net/u013670933/article/details/43836511

1、

print '你好 ，Python！'

报错：

SyntaxError: Non-ASCII character '\xe4' in file p.py on line 1, but no encoding
declared; see http://python.org/dev/peps/pep-0263/ for details

原因：Python默认是以ASCII作为编码方式，如果在自己的Python源码中包含了中文（或者其他的语言），就会无法正确解析。

解决方法：在源码的第一行添加以下语句：

# -*- coding: utf-8 -*-     或者
#coding=utf-8

2、正常显示中文。

#coding=utf-8
print u'你好 ，Python！'

注意：不加 u ，不能正常显示中文。

//相关介绍

因为计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特（bit）作为一个字节（byte），所以，一个字节能表示的最大的整数就是255（二进制11111111=十进制255），0 - 255被用来表示大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母 A 的编码是65，小写字母 z 的编码是122。

如果要表示中文，显然一个字节是不够的，至少需要两个字节，而且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，用来把中文编进去。

类似的，日文和韩文等其他语言也有这个问题。为了统一所有文字的编码，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode通常用两个字节表示一个字符，原有的英文编码从单字节变成双字节，只需要把高字节全部填为0就可以。

因为Python的诞生比Unicode标准发布的时间还要早，所以最早的Python只支持ASCII编码，普通的字符串'ABC'在Python内部都是ASCII编码的。

Python在后来添加了对Unicode的支持，以Unicode表示的字符串用u'...'表示。