楼主最近最毕设需要用到爬虫,于是乎自学Python。出现了系列问题,记录下来。
Python输出字符串问题
错误:Non-ASCIIcharacter '\xe4' in file test.py on line 3, but no encoding declared;
这是因为如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。同样的,其他国家语言也有了自己的标准,所以为了实现统一,出现了Unicode标准,Unicode把所有的语言统一到一套编码里面去,所以就不会出现乱码问题。因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的。
Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'表示,
比如:print u’中国’,但是需要加入下面的注释,这是因为.py文件保存的格式有问题。可以在第一行添加注释,目的是告诉Python解释器,用UTF-8编码读取源代码。然后用Notepad++ 另存为... 并选择UTF-8格式保存。
方法:
注释:(三种任选一种)
1.
#coding:utf-8
print "中国"
print u"中国"
2.
#vim: set fileencoding:utf-8
print "中国"
print u"中国"
3.
#-*-coding:utf-8 -*-
print "中国"
print u"中国"
好了!