Python带你朗读网页

万能的Python大法可以做很多有趣的事情,那我们今天来看看使用简单的Python来实现对一个网页的朗读吧!

首先我们需要装一些必要的库:

readability

它是用来提取网页内的内容的

pip install readability-lxml

640?wx_fmt=png

goose

它是一个文章提取器,我们用它来进行文章的提取

pip install goose3

640?wx_fmt=png

baidu-aip

百度提供的 Python SDK,接口文档:http://ai.baidu.com/docs#/TTS-Online-Python-SDK/top。

pip install baidu-aip

640?wx_fmt=png

对于百度的SDK我们也来简单的教大家用一下:

浏览器输入网址登陆:https://cloud.baidu.com/?from=console

找到语音识别:

640?wx_fmt=png

点进去创建应用:

640?wx_fmt=png

输入一些有用的创建信息:

640?wx_fmt=png

回到管理控制台,获取应用的APPID,apikey,secretkey:

640?wx_fmt=png

写代码的时候会用到,来调用这个接口


pydub

它可以用来生成音频文件,在 Windows 环境需要到 https://ffmpeg.zeranoe.com/builds/ 下载 FFmpeg,并将其配置到环境变量中(如果是使用ubuntu系统,还需要再安装下依赖apt-get install libav-tools)

需要在AudioSegment这个类中,把变量converter换成ffmpeg的路径:

640?wx_fmt=png

640?wx_fmt=png

pip install pydub

640?wx_fmt=png


playsound

播放音频文件用到的包

pip install playsound

640?wx_fmt=png

现在所有的包都安装完毕了,我们可以来安心敲代码了,完成网页到音频的转换。

首先导入用到的包:

import uuid

import re

import os

import argparse

from pydub import AudioSegment

from aip import AipSpeech

from playsound import playsound

from goose3 import Goose

from goose3.text import StopWordsChinese

调用百度语言的api,传入APP_ID, API_KEY, SECRET_KEY:

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

定义函数:文字转化成声音:

640?wx_fmt=png

定义从网页获取文章的函数:

640?wx_fmt=png


将音频文件合并:

640?wx_fmt=png

下面我们就可以运行我们的程序了:

640?wx_fmt=png

640?wx_fmt=jpeg

感兴趣的扫个二维码吧!

目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:目的是使语音技术能在互联网更广泛的应用。每一个页面,只要加入一段javascript脚本就能使用,经过1个多月的努力,终于初步实现的功能,首先在数字报纸上使用:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值