python有声读书_Python爬取喜马拉雅有声书

最新推荐文章于 2024-08-16 09:43:54 发布

weixin_39881575

最新推荐文章于 2024-08-16 09:43:54 发布

阅读量235

点赞数

文章标签： python有声读书

本文链接：https://blog.csdn.net/weixin_39881575/article/details/112878384

版权

# 导入第三方库

import requests

import parsel

# 模拟浏览器

headers = {

"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36"}

def download_media(media_url, media_name):

"""定义下载模块"""

response = requests.get(media_url, headers=headers)

with open(f'{media_name}.mp4', mode="wb") as f:

f.write(response.content)

def media_api(track_id):

"""从网页获取下载地址"""

api_url = f"https://www.ximalaya.com/revision/play/v1/audio?id={track_id}&ptype=1"

resepons = requests.get(api_url, headers=headers)

data = resepons.json()

src = data["data"]["src"]

return src

def get_total_page(page_url):

"""请求每页模块"""

response = requests.get(page_url, headers=headers)

sel = parsel.Selector(response.text)

sound_list = sel.css(".sound-list ul li a")

for sound in sound_list[:30]:

media_url = sound.css("a::attr(href)").extract_first()

media_url = media_url.split("/")[-1]

media_name = sound.css("a::attr(title)").extract_first()

yield media_url, media_name

if __name__ == '__main__':

"""主程序"""

# print(media_api(152693861))

# 循环遍历多页

for page in range(1, 24):

medias = get_total_page(f"https://www.ximalaya.com/youshengshu/20642967/p{page}")

for media_id, media_name in medias:

media_url = media_api(media_id)

download_media(media_url, media_name)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39881575

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小说光看还不够？用Python做有声小说！

qq_46614154的博客

04-14

461

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun 对于小说，想必很多朋友都是十分的喜欢，也很热衷于阅读小说，小说阅读一时爽，一直阅读一直爽。但是小说阅读时间久了，会给我们的眼睛带来很严重的负担，造成眼部的一些不适。 ...

python爬取喜马拉雅vip音频安卓_Python爬虫：爬取喜马拉雅音频数据详解

weixin_39718286的博客

12-11

3549

前言喜马拉雅是专业的音频分享平台，汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频，我最喜欢听民间故事和德云社相声集，你呢？今天带大家爬取喜马拉雅音频数据，一起期待吧！！项目目标爬取喜马拉雅音频数据受害者地址https://www.ximalaya.com/本文知识点：1、系统分析网页性质2、多层数据解析3、海量音频数据保存环境：python 3.6pycha...

参与评论您还未登录，请先登录后发表或查看评论

用7行Python代码构建自己的有声读物

Warmer_Sweeter

11-09

956

点击关注我哦欢迎关注“小白玩转Python”，发现更多 “有趣”有声读物是我们可以通过音频听取一本书或者其他作品的内容，是现下一种很受欢迎的阅读方式。类似的APP有：喜马拉雅、得到和樊...

下载工具大盘点——电脑篇（含有批量下载工具）

最新发布

weixin_66179020的博客

08-16

1342

以下内容均为网上搜集而来，仅供学习交流使用，请尊重各大平台与原创作者！！！

来香一个，用Python做有声小说！

cainiao_python的博客

04-14

383

对于小说，想必很多朋友都是十分的喜欢，也很热衷于阅读小说，小说阅读一时爽，一直阅读一直爽。但是小说阅读时间久了，会给我们的眼睛带来很严重的负担，造成眼部的一些不适。为了解决这个问题，同...

用python实现将pdf转化为有声读物

qq_55977554的博客

02-12

1203

现在看小说已经有了听书这个功能了，但是有时候你想看的书的听书功能收费，这时候可能大家就只能老老实实选择看或者付费听。（还能拿来练英语听力欸嘿嘿）于是我想到，可不可以用python来实现语言播报呢，说干就干，通过上网搜索，发现python中pyttsx3这个模块可以实现语音播报，而pdfplumber或PyPDF2模块实现pdf转化为文字，我采用的是pdfplumber这个模块。首先我们先下载模块，可以自己pip install 模块名，或者通过清华源下载（会更快）清华源地址：https.

来香一个，用Python做有声小说！能听就坚决不看！

爬遍所有网站

05-18

520

对于小说，想必很多朋友都是十分的喜欢，也很热衷于阅读小说，小说阅读一时爽，一直阅读一直爽。但是小说阅读时间久了，会给我们的眼睛带来很严重的负担，造成眼部的一些不适。为了解决这个问题，同时能够让大家体验小说的内容，小编今天带领大家爬取小说，并将小说转化成语音形式，让大家以听的形式来“阅读”小说，同时解放自己的双眼。 01.整体的思路如下首先我们输入想要阅读小说的名称和相应的章节；然后将小说的文本进行爬取并保存到本地的txt文档之中；接下...

python 喜马拉雅_Python爬虫：喜马拉雅FM

weixin_35682327的博客

03-01

1082

Python爬虫：喜马拉雅FM编程派微信号：codingpy自己喜欢在上班的途中听点有声书，所以经常在喜马拉雅上找资源，要找到一个好听的节目不容易，虽然在喜马拉雅官网上可以按分类来看，但是却不能按点赞数或者评论内容排序找，不是很方便。于是就用Python写了个爬虫，把所有声音的相关信息、评论内容都抓取下来，然后放到数据库来分析，这样喜欢什么样的资源，直接根据声音或评论的内容来汇总分析，结果就一目了...

python录音详解_Python爬虫实战案例：取喜马拉雅音频数据详解

weixin_29215815的博客

01-29

370

前言喜马拉雅是专业的音频分享平台，汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频，我最喜欢听民间故事和德云社相声集，你呢？今天带大家爬取喜马拉雅音频数据，一起期待吧！！这个案例的视频地址在这里https://v.douyu.com/show/a2JEMJj3e3mMNxml项目目标爬取喜马拉雅音频数据受害者地址https://www.ximalaya.com...

python下载喜马拉雅音频

04-02

使用python下载喜马拉雅音频，简单下载喜马拉雅全网音频，高质量音频等你来下载。简单粗暴获取全网音频。学习python的圣地。

自动下载喜马拉雅的Python脚本。

10-29

修改脚本里的编号后，自动下载喜马拉雅上的歌曲。只限于m4a格式.免费下载。

基于python的喜马拉雅音乐爬取

04-27

该代码使用python开发，实现了喜马拉雅的音乐获取，并适当的增加了一些文件处理知识，是一个完整的小型项目，代码逻辑清楚，且已经包括了运行环境的配置要求，可以直接运行。

爬取喜马拉雅一本书籍的所有音频V1

09-20

V1版本描述：爬取喜马拉雅网站上书籍的音频，运行时传入书籍ID，会自动判断音频所在页面的页码数，速度快，代码简介，适合Python初学者。 ====================== V1版本已不能使用，请下载V2版本，下载地址： https://download.csdn.net/download/njutlb/12121450

用Python制作有声小说

Python数据之道

06-11

992

作者：菜鸟哥来源：程序员GitHub大家好，欢迎来到「Python数据之道」！有不少朋友都热衷于看小说。俗话说：小说阅读一时爽，一直阅读一直爽。但是小说阅读时间久了，会给我们的眼睛带来...

python下载想听的有声书，让喜马拉雅收费，我是程序员！

weixin_34407348的博客

11-07

1942

from urllib import parse,request import urllib header_dict = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Trident/7.0; rv:11.0) like Gecko'} for i in range(1328,3000): url="https://ting55....

Python制作专属有声小说（调用百度语音合成接口）

人生苦短，还不用Python？

05-21

1986

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者：merlin& 这一次的目标是使用百度云的人工智能接口，实现文字转语音的实时转换，将小说文字转换成语音朗读出来。百度云接口调用百度的这个接口对于我们普通用户非常友好，他的很多功能都是免费的，而且我们每天可以免费调用这个接口五千次，非常适合我们玩转这些功能。注册百度云账号首先打开百度云语音合成模块接口地址打开网址后点击《立即使用》选项，然后会出现登录的选项界面。

Python网络爬虫：批量下载喜马拉雅音频

有意栽花花不发，无心插柳柳成荫。

05-16

3695

hello，大家好，我是wangzirui32，今天我们来学习如何批量下载喜马拉雅音频。开始学习吧！学习目录1. 解析网站1.1 获取音频地址1.2 解析专栏网页1.3 整理亿下思路2. 编写爬取代码 1. 解析网站 1.1 获取音频地址在喜马拉雅网站上，随便点开一个音频，打开“开发者工具”，再点击播放按钮，可以看到出现了多个请求：经过排查，发现可疑url: 查看它的响应信息，发现音频地址就在里面：接下来，解析这个返回音频地址的url： https://www.ximalaya.com/revis

Python使用lxml高效爬取豆瓣读书排行榜详解

"本文主要介绍了如何使用Python的lxml模块高效地爬取豆瓣读书排行榜的数据，包括书名、评分、评价数、出版社、出版年份等信息。文章首先对比了lxml与BeautifulSoup库的爬取效率，指出lxml的优势在于语法简洁和速度更...