python关于windows创建含有中文字符串的文件夹及文件时乱码的问题处理

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_19339041/article/details/81611320

文件夹和文件的名字里面含有中文字符串时出现乱码的处理:

把该字符串编码转换为unicode或gbk编码的字符串来解决。代码第二行如有声明编码格式如utf-8,则代码里面出现中文字符串的地方就按照utf-8格式的字符串去处理;如没有编码声明,则windows系统默认为gbk编码,而linux默认为utf-8编码。

#!/usr/bin/env python
# coding:utf-8
import os


# 对变量s的值字符串 '中国' 按utf-8编码处理
s = '中国'

# 创建的文件夹为乱码,乱码原因:代码编码为utf-8的中文字符串,但windows系统默认使用gbk编码,所以会乱码,只有它们一致才不乱码
# os.mkdir(s)

# 下面2种方法都能创建含有中文字符串的文件夹及文件

# 把s的值进行解码,由于其为utf-8编码,所以使用utf-8解码
# os.mkdir(s.decode('utf-8'))

# windows系统的文件夹和文件的名字需要为unicode或gbk编码的字符串,才可以正常显示不乱码。
# os.mkdir(s.decode('utf-8').encode('gbk'))

# f = open(s.decode('utf-8') + '.txt','w')
f = open(s.decode('utf-8').encode('gbk') + '.txt','w')
f.close()

此外,还发现一个现象,是否在使用unittest模块时,创建含有中文名字的文件夹时,是有区别的。

没有使用unittest模块时,可以直接创建含有中文的文件夹,也没出现乱码。代码如下,

#!/usr/bin/env python
# coding:utf-8
import os
import chardet


s = raw_input('请输入要创建的文件夹名字:')
# s的值为ascii字符串,即gbk字符串
print chardet.detect(s)
# 发现不在unittest模块里面,可以不用编码解码处理,直接进行创建含有中文字符串的文件夹,结果也没发现乱码。而且文件代码声明为utf-8,也没有进行转码,真是不可思议。
os.mkdir(s)
os.chdir(s)
展开阅读全文

没有更多推荐了,返回首页