SPEECH
文章平均质量分 60
远洋之帆
机器学习 人工智能 数学 数据可视化 机器人
展开
-
短视频封面抽取和标题自动化生成
人像抽取部分0.视频字幕去除# 安装 AgentOCR!pip install agentocr# 安装 CPU 版本 ONNXRuntime!pip install onnxruntimeimport cv2import numpy as npfrom PIL import Imageimport matplotlib.pyplot as pltdef image_remove_word(img_path = 'images/frame.177000000.jpg'):..原创 2022-05-07 07:56:03 · 2128 阅读 · 0 评论 -
Tensorflow入门教程(三十)语音识别(中)
------韦访 201811266、提取音频数据的MFCC特征上一讲花了很大的篇幅来将这个MFCC特征,现在我们就来提取它。Python牛逼之处就是有非常多的工具支持各种操作,很完善,所以这里也不需要我们从头开始写,可以借助python_speech_features工具来实现。首先来安装python_speech_features工具,执行以下命令行即可,sudo pip in...转载 2018-12-24 20:29:25 · 6099 阅读 · 4 评论 -
语音合成——语音合成是从离散到连续回归,语音识别是从连续到离散
语音合成原理像一点,再像一点硬币的正反面转载 2019-03-19 15:44:01 · 564 阅读 · 0 评论 -
语音合成技术概述
语音合成,又称文语转换(Text To Speech, TTS),是一种可以将任意输入文本转换成相应语音的技术。传统的语音合成系统通常包括前端和后端两个模块。前端模块主要是对输入文本进行分析,提取后端模块所需要的语言学信息,对于中文合成系统而言,前端模块一般包含文本正则化、分词、词性预测、多音字消歧、韵律预测等子模块。后端模块根据前端分析结果,通过一定的方法生成语音波形,后端系统一般分为基于统...转载 2019-03-22 17:58:30 · 7210 阅读 · 1 评论