喜马拉雅下载文件解决办法

这几天在做喜马拉雅的音频实验,找素材找了好几天,头都要炸了。导师要求我下载5000首以上,还要电脑端和手机端分别下载,不同的音质要分别下载一遍。关键是喜马拉雅为了保护版权,做了许多处理,有许多坑,欲哭无泪。

手机端:手机端最大的好处是提供多种音质的选择,可以充分的获取实验素材。不过官方为了不让用户下载之后随意分享,做了两件事:一、将文件后缀名去除(格式是mp3,但没有后缀名);二、文件名处理为乱码(此处我怀疑是用的散列函数md5,但是不清楚盐值所以解密失败)

如果要下载的内容太多,推荐使用手机模拟器(当然直接使用手机也是可以的,前提是你的手机存储足够用)。

本文主要解决:喜马拉雅下载文件名乱码问题

目录

一、手机端

1.安装模拟器(直接用手机跳转到)

2.对软件限制下载速度

 3.批量下载文件,然后保存为压缩格式

4.用python脚本批量修改名称

二、电脑端

1.通过客户端下载

2.喜马拉雅下载器下载

三、声明


一、手机端

1.安装模拟器(直接用手机下载看第2步)

我测试的时候用的是网易的mumu模拟器,直接百度就能下载,安装成功后导入喜马拉雅的apk安装包

同手机一样的使用方式

2.对软件限制下载速度

 手机用户请自行搜索:如何限制软件的下载速度

电脑上我用的是腾讯电脑管家:直接百度搜索腾讯电脑管家就可以下载

安装后

这两个是模拟器的程序,右键限速。限速的大小由需要下载的文件大小决定,务必保证两个文件的下载间隔在1秒以上如:

这里文件基本在100KB左右,最小的也有85KB,故限速比85稍小一些,大约为85的三分之二,使得每下一首的时间都要超过1秒。

 3.批量下载文件,然后保存为压缩格式

手机的下载目录一般为:Android\data\com.ximalaya.ting.android\files\download

值得注意的是:不要用一键下载本页(这种是逆序下载),选择选集下载,一次不要选中太多选集,否则顺序也会乱,本人用一次下载一个选集和一次下载三个选集均成功得到顺序文件,而一次下载九个选集得到的是稍有混乱的顺序,欢迎大家来尝试。在一次下载完成前,不要急着添加下载选集,最好等正在下载的文件结束,再添加选集下载。

整体压缩的目的是为了保存文件夹内文件的修改时间,这是后面排序重命名的依据。将压缩包复制到电脑上(模拟器可以先复制到mumu共享文件夹,然后共享给电脑),在电脑上解压,按修改时间排序,此时排序的音频与下载列表逐个对应。不嫌麻烦地可以一条一条对照着重命名,有编程基础的可以自己写一个程序批量重命名。

4.用python脚本批量修改名称

 知识储备:

 如何获取文件的时间属性
#   os.path.getatime(file) 输出文件访问时间
#   os.path.getctime(file) 输出文件的创建时间
#   os.path.getmtime(file) 输出文件最近修改时间

import os

#获取文件名列表(按文件名顺序排列)
filenames = os.listdir(r'下载的音频的文件夹路径')
#print(filenames)

#print(len(filenames))

#获取文件的修改时间
def fileTime(file):
    return [
        #time.ctime(os.path.getmtime(file))
        os.path.getmtime(file)
    ]

#创建时间-文件名的集合(此时仍为文件名排序)
#file_time是键为float型表时间,值为str型表文件名,float值越小时间越靠前
file_time = {}
for file in filenames:
    times = fileTime(r'下载的音频的文件夹路径\\' + file)[0]
    file_time[times] = file

#nameindex保存排序后的文件名(顺序为时间的升序)
nameindex = []
for key in sorted(file_time.keys()):
    nameindex.append(file_time[key])
print(nameindex)

#对应喜马拉雅专辑页的音频列表(要保证顺序和喜马拉雅一致)
filelist = os.listdir(r'音频列表的文件路径')
#print(filelist)

print(len(filelist))
print(len(nameindex))
if len(filelist) == len(nameindex) :
    for i in range(len(nameindex)):
        os.rename(r'下载的音频的文件夹路径\\' + nameindex[i],
                  r'下载的音频的文件夹路径' + filelist[i])

更改文件路径参数使用 

对应喜马拉雅的音频列表,建议用爬虫获取,务必要保证顺序是对的。 

二、电脑端

1.通过客户端下载

旧版本的喜马拉雅会提供一个list.json文件实现文件名的对照,新版本已经取消了;新版本没有文件名乱码问题,而是使用一种xm格式的文件,csdn上已经有大佬给出了如何将xm转为mp3格式的文章,这里不再赘述。

2.喜马拉雅下载器下载

网上有喜马拉雅的下载器,提供专辑名就可以批量的解析下载。

三、声明

本人不提供任何下载工具,使用的均为正规合法软件,这里仅提供了一种下载思路,希望大家严格遵守版权法。实验中下载的音频皆为本人自己上传的无损非商用的音频。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值