这几天在做喜马拉雅的音频实验,找素材找了好几天,头都要炸了。导师要求我下载5000首以上,还要电脑端和手机端分别下载,不同的音质要分别下载一遍。关键是喜马拉雅为了保护版权,做了许多处理,有许多坑,欲哭无泪。
手机端:手机端最大的好处是提供多种音质的选择,可以充分的获取实验素材。不过官方为了不让用户下载之后随意分享,做了两件事:一、将文件后缀名去除(格式是mp3,但没有后缀名);二、文件名处理为乱码(此处我怀疑是用的散列函数md5,但是不清楚盐值所以解密失败)
如果要下载的内容太多,推荐使用手机模拟器(当然直接使用手机也是可以的,前提是你的手机存储足够用)。
本文主要解决:喜马拉雅下载文件名乱码问题
目录
一、手机端
1.安装模拟器(直接用手机下载看第2步)
我测试的时候用的是网易的mumu模拟器,直接百度就能下载,安装成功后导入喜马拉雅的apk安装包
同手机一样的使用方式
2.对软件限制下载速度
手机用户请自行搜索:如何限制软件的下载速度
电脑上我用的是腾讯电脑管家:直接百度搜索腾讯电脑管家就可以下载
安装后
这两个是模拟器的程序,右键限速。限速的大小由需要下载的文件大小决定,务必保证两个文件的下载间隔在1秒以上如:
这里文件基本在100KB左右,最小的也有85KB,故限速比85稍小一些,大约为85的三分之二,使得每下一首的时间都要超过1秒。
3.批量下载文件,然后保存为压缩格式
手机的下载目录一般为:Android\data\com.ximalaya.ting.android\files\download
值得注意的是:不要用一键下载本页(这种是逆序下载),选择选集下载,一次不要选中太多选集,否则顺序也会乱,本人用一次下载一个选集和一次下载三个选集均成功得到顺序文件,而一次下载九个选集得到的是稍有混乱的顺序,欢迎大家来尝试。在一次下载完成前,不要急着添加下载选集,最好等正在下载的文件结束,再添加选集下载。
整体压缩的目的是为了保存文件夹内文件的修改时间,这是后面排序重命名的依据。将压缩包复制到电脑上(模拟器可以先复制到mumu共享文件夹,然后共享给电脑),在电脑上解压,按修改时间排序,此时排序的音频与下载列表逐个对应。不嫌麻烦地可以一条一条对照着重命名,有编程基础的可以自己写一个程序批量重命名。
4.用python脚本批量修改名称
知识储备:
如何获取文件的时间属性
# os.path.getatime(file) 输出文件访问时间
# os.path.getctime(file) 输出文件的创建时间
# os.path.getmtime(file) 输出文件最近修改时间
import os
#获取文件名列表(按文件名顺序排列)
filenames = os.listdir(r'下载的音频的文件夹路径')
#print(filenames)
#print(len(filenames))
#获取文件的修改时间
def fileTime(file):
return [
#time.ctime(os.path.getmtime(file))
os.path.getmtime(file)
]
#创建时间-文件名的集合(此时仍为文件名排序)
#file_time是键为float型表时间,值为str型表文件名,float值越小时间越靠前
file_time = {}
for file in filenames:
times = fileTime(r'下载的音频的文件夹路径\\' + file)[0]
file_time[times] = file
#nameindex保存排序后的文件名(顺序为时间的升序)
nameindex = []
for key in sorted(file_time.keys()):
nameindex.append(file_time[key])
print(nameindex)
#对应喜马拉雅专辑页的音频列表(要保证顺序和喜马拉雅一致)
filelist = os.listdir(r'音频列表的文件路径')
#print(filelist)
print(len(filelist))
print(len(nameindex))
if len(filelist) == len(nameindex) :
for i in range(len(nameindex)):
os.rename(r'下载的音频的文件夹路径\\' + nameindex[i],
r'下载的音频的文件夹路径' + filelist[i])
更改文件路径参数使用
对应喜马拉雅的音频列表,建议用爬虫获取,务必要保证顺序是对的。
二、电脑端
1.通过客户端下载
旧版本的喜马拉雅会提供一个list.json文件实现文件名的对照,新版本已经取消了;新版本没有文件名乱码问题,而是使用一种xm格式的文件,csdn上已经有大佬给出了如何将xm转为mp3格式的文章,这里不再赘述。
2.喜马拉雅下载器下载
网上有喜马拉雅的下载器,提供专辑名就可以批量的解析下载。
三、声明
本人不提供任何下载工具,使用的均为正规合法软件,这里仅提供了一种下载思路,希望大家严格遵守版权法。实验中下载的音频皆为本人自己上传的无损非商用的音频。