说明
如果文件的名字包含了中文数字, 在dir列表的时候, 会显得比较混乱, 为了方便, 需要对这些中文数字进行转换, 推荐一个很不错的库 cn2an
cn2an
用法
res = cn2an.cn2an('二百')
print(1, res) # 1 200
res = cn2an.cn2an('二〇一','smart')
print(2, res) # 2 201
cn2an() 说明
其实也没啥可以说明的,看源码就懂
def cn2an(self, inputs: Union[str, int, float] = None, mode: str = "strict") -> Union[float, int]:
"""中文数字转阿拉伯数字
:param inputs: 中文数字、阿拉伯数字、中文数字和阿拉伯数字
:param mode: strict 严格,normal 正常,smart 智能
:return: 阿拉伯数字
"""
替换目录下的文件的名称
import re
import os,sys
import cn2an
common_used_numerals_tmp ={'零':0, '一':1, '二':2, '两':2, '三':3, '四':4, '五':5, '六':6, '七':7, '八':8, '九':9, '十':10, '百':100, '千':1000, '万':10000, '亿':100000000}
# 使用正则找到中文数字的字符串 第五十二章 ==> 五十二
def chinese_match(source:str,pos=0,endpos=sys.maxsize) :
pattern = r"[一二三四五六七八九十百千万]+"
# pattern = f'[{''.join(dic_num.keys())}{''.join(dic_unit.keys())}]+'
rex = re.compile(pattern)
match = rex.search(source,pos,endpos)
# print(source[pos:endpos])
return match
# 整体替换中文数字 第五十二章 ==> 第52章
def chinese_to_digit(source_str:str,digits:int,pos=0,endpos=sys.maxsize):
match = chinese_match(source_str,pos,endpos)
if not match:
return source_str
zh_str = match.group(0)
# zh_num = chstring2int(zh_str)
zh_num = cn2an.cn2an(zh_str,'smart')
return f'{source_str[0:match.start()]}{zh_num:0>{digits}}{source_str[match.end():]}'
# 文件重命名 file_name ==> des_name
def rename_file_name(file_name:str,des_name:str):
if file_name == des_name:
return
os.rename(file_name,des_name) # 同名
# 目录下的文件重命名阿拉伯数字名 第一回 灵根育孕源流出 心性修持大道生.txt ==> 第001回 灵根育孕源流出 心性修持大道生.txt
def ch_dir_files_name(dir_path:str,digits,pos=0,endpos=sys.maxsize):
save_dir = os.getcwd()
# file_list = []
os.chdir(dir_path)
path_list = os.listdir()
for path in path_list:
if os.path.isfile(path):
src_name = path
dst_name = chinese_to_digit(path,digits,pos,endpos)
# file_list.append(dst_name)
rename_file_name(src_name,dst_name)
os.chdir(save_dir)
if __name__ == '__main__':
sour_list = [
"第八回 我佛造经传极乐 观音奉旨上长安.txt",
"第二十二回 悟彻菩提真妙理 断魔归本合元神.txt",
"第九回 袁守诚妙算无私曲 老龙王拙计犯天条.txt",
"第六回 观音赴会问原因 小圣施威降大圣.txt",
"第七回 八卦炉中逃大圣 五行山下定心猿.txt",
"第三回 四海千山皆拱伏 九幽十类尽除名.txt",
"第四回 官封弼马心何足 名注齐天意未宁.txt",
"第五回 乱蟠桃大圣偷丹 反天宫诸神捉怪.txt",
"第一回 灵根育孕源流出 心性修持大道生.txt",
"附录 陈光蕊赴任逢灾 江流僧复仇报本.txt",
]
for source in sour_list:
res = chinese_to_digit(source,3,0,5)
print(res)
res = cn2an.cn2an('二百')
print(1, res) # 1 200
res = cn2an.cn2an('二〇一','smart')
print(2, res) # 2 201
# 替换目录的方法
dir_path = '西游记 copy'
ch_dir_files_name(dir_path,3,0,5)