建议在python2.x中尝试:
# -*- coding: utf-8 -*-
# 使用python2.x解释器,可以看出源代码不同编码的时的区别
s0 = '中文'
print (repr(s0))
# 若是 coding:gbk 则输出 '\xd6\xd0\xce\xc4'
# 若是 coding:utf-8 则输出 '\xe4\xb8\xad\xe6\x96\x87'
若是在 python3.x中尝试:
# -*- coding: utf-8 -*-
# 使用python2.x解释器,可以看出源代码不同编码的时的区别
s0 = '中文'
print (repr(s0))
# 若是 coding:gbk 则输出 '中文'
# 若是 coding:utf-8 则输出 '中文'
看不出明显的区别;
注:
- 改变源代码编码格式的语句,与正则表达式有关,有时间再看;
- 改变源代码编码格式的语句必须写在源文件的第一行或者第二行;
- 写源代码的编码格式语句有助于程序的可移植性