python关于windows创建含有中文字符串的文件夹及文件时乱码的问题处理

文件夹和文件的名字里面含有中文字符串时出现乱码的处理:

把该字符串编码转换为unicode或gbk编码的字符串来解决。代码第二行如有声明编码格式如utf-8,则代码里面出现中文字符串的地方就按照utf-8格式的字符串去处理;如没有编码声明,则windows系统默认为gbk编码,而linux默认为utf-8编码。

#!/usr/bin/env python
# coding:utf-8
import os


# 对变量s的值字符串 '中国' 按utf-8编码处理
s = '中国'

# 创建的文件夹为乱码,乱码原因:代码编码为utf-8的中文字符串,但windows系统默认使用gbk编码,所以会乱码,只有它们一致才不乱码
# os.mkdir(s)

# 下面2种方法都能创建含有中文字符串的文件夹及文件

# 把s的值进行解码,由于其为utf-8编码,所以使用utf-8解码
# os.mkdir(s.decode('utf-8'))

# windows系统的文件夹和文件的名字需要为unicode或gbk编码的字符串,才可以正常显示不乱码。
# os.mkdir(s.decode('utf-8').encode('gbk'))

# f = open(s.decode('utf-8') + '.txt','w')
f = open(s.decode('utf-8').encode('gbk') + '.txt','w')
f.close()

此外,还发现一个现象,是否在使用unittest模块时,创建含有中文名字的文件夹时,是有区别的。

没有使用unittest模块时,可以直接创建含有中文的文件夹,也没出现乱码。代码如下,

#!/usr/bin/env python
# coding:utf-8
import os
import chardet


s = raw_input('请输入要创建的文件夹名字:')
# s的值为ascii字符串,即gbk字符串
print chardet.detect(s)
# 发现不在unittest模块里面,可以不用编码解码处理,直接进行创建含有中文字符串的文件夹,结果也没发现乱码。而且文件代码声明为utf-8,也没有进行转码,真是不可思议。
os.mkdir(s)
os.chdir(s)
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值