python检验文件命名_Python如何检查文件名是否为UTF8?

我有一个PHP脚本,它在一个目录中创建一个文件列表,但是PHP只能看到英文的文件名,完全忽略其他语言的文件名,例如俄语或亚洲语言。

经过大量的努力,我找到了唯一适合我的解决方案——使用一个python脚本将文件重命名为UTF8,这样PHP脚本就可以在之后处理它们。

(在PHP处理完这些文件之后,我将这些文件重命名为英语,而不是使用UTF8)。

我使用了以下python脚本,效果很好:import sys

import os

import glob

import ntpath

from random import randint

for infile in glob.glob( os.path.join('C:\\MyFiles', u'*') ):

if os.path.isfile(infile):

infile_utf8 = infile.encode('utf8')

os.rename(infile, infile_utf8)

问题是它还可以转换已经在UTF8中的文件名。如果文件名已经是UTF8,我需要一种跳过转换的方法。

我在尝试这个python脚本:for infile in glob.glob( os.path.join('C:\\MyFiles', u'*') ):

if os.path.isfile(infile):

try:

infile.decode('UTF-8', 'strict')

except UnicodeDecodeError:

infile_utf8 = infile.encode('utf8')

os.rename(infile, infile_utf8)

但是,如果文件名已经在utf8中,则会出现致命错误:UnicodeDecodeError: 'ascii' codec can't decode characters in position 18-20

ordinal not in range(128)

我还尝试了另一种方法,但也没有成功:for infile in glob.glob( os.path.join('C:\\MyFiles', u'*') ):

if os.path.isfile(infile):

try:

tmpstr = str(infile)

except UnicodeDecodeError:

infile_utf8 = infile.encode('utf8')

os.rename(infile, infile_utf8)

我犯了和以前完全一样的错误。

有什么想法吗?

Python对我来说是非常新的,即使是一个简单的脚本,调试也是一项巨大的工作,所以请写一个明确的答案(即代码)。我没有能力测试那些可能有用或不有用的一般性想法。谢谢。

文件名示例:hello.txt

你好.txt

안녕하세요.html

chào.doc

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值