有爱听《红楼梦》的程同行吗?Python 对红楼梦音频文件排序

背景

2022年从网络公开渠道爬到了蒋勋老师的细说红楼梦80回的音频,爬虫得到的文件命名是乱序的,曾经想排序来的,后来就忘记了。

最近突然想起这套音频资源了,想着做个排序吧。

未排序之前,按爬虫的顺序存储的文件:
在这里插入图片描述

解决办法

找到写了一半的代码,继续完善。主要思路:遍历目标文件,解析每个文件中的章回数,然后再对文件名称拼接上两位数字的章回数后,重命名。

Python 源码:

import os
#目标目录
dir = '/Applications/2022MyTextFiles/80回蒋勋讲红楼梦'
#汉字和数字映射关系
chinese_numbers = {
        '一':'1',
        '二':'2',
        '三':'3',
        '四':'4',
        '五':'5',
        '六':'6',
        '七':'7',
        '八':'8',
        '九':'9',
        '十': '0'
}

# 遍历文件:重命名
for root, dirs, files in os.walk(dir):
    for file in files:
        #查找章回的位置,且必须排除掉系统文件
        if file == '.DS_Store':
            continue

        print(file)
        indexOfOrder=file.index("回")

        # 找回数
        ordNum=file[1:indexOfOrder]
        #文件名称前拼接两位数的回数,总共就5种情况
        newName=''
        if ordNum == '十' : # 第十回
            newName='10'
        elif ordNum.endswith('十'):#第十回
            newName=chinese_numbers[ordNum[0]]+'0'
        elif len(ordNum) == 1: #第一~九回
            newName = '0'+chinese_numbers[ordNum[0]]
        elif ordNum.startswith('十'):#第几十回
            newName = '1'+chinese_numbers[ordNum[1]]
        else:#第几十几回
            newName = chinese_numbers[ordNum[0]]+chinese_numbers[ordNum[2]]

        #重命名,注意加上文件根路径
        os.rename(root+'/'+file,root+'/'+newName+file)

print('完成')

排序效果:
在这里插入图片描述
按章回序号排序后,顺眼多了!

启示录

2016年在某平台听到《蒋勋细说红楼》音频,相见恨晚,听了一阵,后来音频收费且贵,甚是遗憾。直到2022年发现了蒋勋老师的官号,也找到一个公开渠道。激动之余怕又找不到了,就用爬虫抓下来,偶尔听听。

今年那个公开网址已经不可达了还好当时头脑一热,用 Python 抓到本地了。今年又想起来继续听,打工人的精神食粮啊,妥妥的!

个人用法:青少年文学启蒙,失眠夜里听听,闲暇时光里当作背景乐……曾经高中几个晚自习都没理明白的人物关系,二十年后在这些音频中找到了答案。年少时残存的文学细胞觉醒的中年人,值得一听哦!

有喜欢听《蒋勋细说红楼梦》的程序员吗?需要资源的话,可以分享。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值