python中文编码相关问题

胜天半子_王二_王半仙

已于 2022-12-01 20:32:13 修改

阅读量1.8k

点赞数 1

分类专栏： python高级文章标签： python

于 2022-05-16 18:27:28 首次发布

本文链接：https://blog.csdn.net/qq_40666620/article/details/124805123

版权

23 篇文章 0 订阅

订阅专栏

我这里使用的环境是python2.7

如获取路径，去读取文件，可以直接使用，不进行特殊处理
如果是中文路径的话，不用关心，直接使用路径即可，因为读取出来的就是gbk格式的，如下：

print __file__
print os.path.realpath(__file__)
#这个目录下如果有文件，我们是可以直接使用这个路径进行读取的

但是你要是输出出来的话，肯定是乱码，因为这里是gbk格式的，我们用的ide大概率是utf-8的，这个不用管，程序能知道就行，如果你你非要看一下的话，那么直接用gbk解码就行了，如下：

print __file__.decode('gbk')
print os.path.realpath(__file__.decode('gbk'))

x = '你好世界'
print x.decode('utf-8').encode('gbk')

qt初始化的时候，如果要指定qt的插件路径，那么我们要传进去unicode，所以要用gbk解码一下

下面两个地方最好也用gbk解码下

ctypes.windll.shell32.ShellExecuteW(None, u"runas", unicode(sys.executable.decode('gbk')), unicode(__file__.decode('gbk')), None, 1)

这个方法是用来列举文件夹下文件的,接受一个unicode的参数,所以

大结局

python2默认是unicode编码
decode就是特殊编码转python2默认的unicode
encode就是python2默认地unicode转特殊编码

x = u'你好世界'

两个字符串拼接的时候, 只要有一个是unicode, 另一个也必须是unicode, 例如

x = u'你好世界'
y = str('你好世界')

print x, type(x)
print y, type(y)

print '{}{}'.format(x, y)
print '%s, %s' % (x, y)

中文str转中文unicodedecode('utf-8')
中文unicode转中文strencode('utf-8')
所以两个字符串拼接, 不确定是str还是unicode的时候, 可以这样

a = get_a()
b = get_b()
if isinstance(a, unicode):
	a = a.encode('utf-8')
if isinstance(b, unicode):
	b = b.encode('utf-8)
res = '{}{}'.format(a, b)

关注

专栏目录