我有一个PHP脚本,它在一个目录中创建一个文件列表,但是PHP只能看到英文的文件名,完全忽略其他语言的文件名,例如俄语或亚洲语言。
经过大量的努力,我找到了唯一适合我的解决方案——使用一个python脚本将文件重命名为UTF8,这样PHP脚本就可以在之后处理它们。
(在PHP处理完这些文件之后,我将这些文件重命名为英语,而不是使用UTF8)。
我使用了以下python脚本,效果很好:import sys
import os
import glob
import ntpath
from random import randint
for infile in glob.glob( os.path.join('C:\\MyFiles', u'*') ):
if os.path.isfile(infile):
infile_utf8 = infile.encode('utf8')
os.rename(infile, infile_utf8)
问题是它还可以转换已经在UTF8中的文件名。如果文件名已经是UTF8,我需要一种跳过转换的方法。
我在尝试这个python脚本:for infile in glob.glob( os.path.join('C:\\MyFiles', u'*') ):
if os.path.isfile(infile):
try:
infile.decode('UTF-8', 'strict')
except UnicodeDecodeError:
infile_utf8 = infile.encode('utf8')
os.rename(infile, infile_utf8)
但是,如果文件名已经在utf8中,则会出现致命错误:UnicodeDecodeError: 'ascii' codec can't decode characters in position 18-20
ordinal not in range(128)
我还尝试了另一种方法,但也没有成功:for infile in glob.glob( os.path.join('C:\\MyFiles', u'*') ):
if os.path.isfile(infile):
try:
tmpstr = str(infile)
except UnicodeDecodeError:
infile_utf8 = infile.encode('utf8')
os.rename(infile, infile_utf8)
我犯了和以前完全一样的错误。
有什么想法吗?
Python对我来说是非常新的,即使是一个简单的脚本,调试也是一项巨大的工作,所以请写一个明确的答案(即代码)。我没有能力测试那些可能有用或不有用的一般性想法。谢谢。
文件名示例:hello.txt
你好.txt
안녕하세요.html
chào.doc