【Python】 目录文件中文数字转换

说明

如果文件的名字包含了中文数字, 在dir列表的时候, 会显得比较混乱, 为了方便, 需要对这些中文数字进行转换, 推荐一个很不错的库 cn2an

在这里插入图片描述

cn2an

用法

    res = cn2an.cn2an('二百')
    print(1, res)   # 1 200
    res = cn2an.cn2an('二〇一','smart')
    print(2, res)   # 2 201

cn2an() 说明

其实也没啥可以说明的,看源码就懂

    def cn2an(self, inputs: Union[str, int, float] = None, mode: str = "strict") -> Union[float, int]:
        """中文数字转阿拉伯数字

        :param inputs: 中文数字、阿拉伯数字、中文数字和阿拉伯数字
        :param mode: strict 严格,normal 正常,smart 智能
        :return: 阿拉伯数字
        """

替换目录下的文件的名称

import re
import os,sys
import cn2an

common_used_numerals_tmp ={'零':0, '一':1, '二':2, '两':2, '三':3, '四':4, '五':5, '六':6, '七':7, '八':8, '九':9, '十':10, '百':100, '千':1000, '万':10000, '亿':100000000}

# 使用正则找到中文数字的字符串   第五十二章 ==> 五十二
def chinese_match(source:str,pos=0,endpos=sys.maxsize) :
    pattern = r"[一二三四五六七八九十百千万]+"
    # pattern = f'[{''.join(dic_num.keys())}{''.join(dic_unit.keys())}]+'
    rex = re.compile(pattern)
    match = rex.search(source,pos,endpos)
    # print(source[pos:endpos])
    return match

# 整体替换中文数字 第五十二章 ==> 第52章
def chinese_to_digit(source_str:str,digits:int,pos=0,endpos=sys.maxsize):
    match = chinese_match(source_str,pos,endpos) 
    if not match:
        return source_str
    zh_str = match.group(0)
    # zh_num = chstring2int(zh_str)
    zh_num = cn2an.cn2an(zh_str,'smart')
    return f'{source_str[0:match.start()]}{zh_num:0>{digits}}{source_str[match.end():]}'

# 文件重命名  file_name ==> des_name
def rename_file_name(file_name:str,des_name:str):
    if file_name == des_name:
        return
    os.rename(file_name,des_name) # 同名

# 目录下的文件重命名阿拉伯数字名    第一回 灵根育孕源流出 心性修持大道生.txt  ==> 第001回 灵根育孕源流出 心性修持大道生.txt
def ch_dir_files_name(dir_path:str,digits,pos=0,endpos=sys.maxsize):
    save_dir = os.getcwd()
    # file_list = []
    os.chdir(dir_path)
    path_list = os.listdir()
    for path in path_list:
        if os.path.isfile(path):
            src_name = path
            dst_name = chinese_to_digit(path,digits,pos,endpos)
            # file_list.append(dst_name)
            rename_file_name(src_name,dst_name)
    os.chdir(save_dir)

if __name__ == '__main__':
    sour_list = [
        "第八回 我佛造经传极乐 观音奉旨上长安.txt",
        "第二十二回 悟彻菩提真妙理 断魔归本合元神.txt",
        "第九回 袁守诚妙算无私曲 老龙王拙计犯天条.txt",
        "第六回 观音赴会问原因 小圣施威降大圣.txt",
        "第七回 八卦炉中逃大圣 五行山下定心猿.txt",
        "第三回 四海千山皆拱伏 九幽十类尽除名.txt",
        "第四回 官封弼马心何足 名注齐天意未宁.txt",
        "第五回 乱蟠桃大圣偷丹 反天宫诸神捉怪.txt",
        "第一回 灵根育孕源流出 心性修持大道生.txt",
        "附录 陈光蕊赴任逢灾 江流僧复仇报本.txt",
    ]

    for source in sour_list:
        res = chinese_to_digit(source,3,0,5)
        print(res)

    res = cn2an.cn2an('二百')
    print(1, res)   # 1 200
    res = cn2an.cn2an('二〇一','smart')
    print(2, res)   # 2 201
    
    # 替换目录的方法
    dir_path = '西游记 copy'
    ch_dir_files_name(dir_path,3,0,5)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值