语音处理
文章平均质量分 80
davidullua
前华为人,ATM架构师,日常开发经验分享,互联网架构分享
展开
-
如何用4行 C 代码实现一个跨平台的命令行 mp3 播放器
要实现一个 mp3 音乐播放器,首先要有能够播放音乐的类库,并且支持 mp3 协议。网上没有看到代码简洁清晰的最小命令行的 mp3 播放器的实现。 调研了几个类库之后实现了一个,供需要的朋友参考。原创 2022-09-09 23:56:48 · 1442 阅读 · 0 评论 -
语音处理/语音识别基础(六)- 语音的端点检测(EPD/VAD)
「端点检测」(End-point Detection,简称 EPD)的目标是要找到音讯开始和结束的位置,所以又可以称为 Speech Detection 或是 VAD (Voice Activity Detection)。端点检测在音讯处理与识别中,扮演重要的角色,可以基于时域,或者基于频域来做 EPD。原创 2022-02-24 10:28:26 · 22486 阅读 · 7 评论 -
语音处理/语音识别基础(五)- 声音的音量,过零率,音高的计算
如前面第3篇讲到,声音的几个主要特征有音量 Volume, 音高 Pitch, 音色 Timbre。另外有一个重要的特征是过零率 zero crossing rate。当我们在分析声音时,通常以「短时距分析」(Short-term Analysis)为主,因为音讯在短时间内是相对稳定的。我们通常将声音先切成帧(Frame),每一帧长度大约在 20 ms 左右,再根据帧内的信号来进行分析。计算音量(Volume/Intensity/Energe)「音量」代表声音的强度,又称为「响度」、原创 2022-02-14 09:45:00 · 15474 阅读 · 3 评论 -
语音处理/语音识别基础(四)- 语音文件读取与播放
本文分享如何在 matlab 里面读取 wav 文件,播放 wav 文件,以及如何录制语音文件,保存语音文件。代码中演示了如何改变音频文件的采样率(影响到播放速度),音量(影响到听到的声音大小)。原创 2022-02-13 22:10:12 · 5537 阅读 · 1 评论 -
语音处理/语音识别基础(三)- 声音的特征和声音的能量
前面分享了声音是什么,声音是如何产生,如何传播,以及如何数字化存储的。现在我们来看一下声音有哪些主要的特征(对于人来说),以及常说的声音的能量指的是什么。 本文尝试回答如下问题:1).对于人来说, 声音有哪些主要的特征,会影响人的感知?2).男人和女人,成人和儿童的声音听起来有差异,主要是什么特征起的作用?3).不同乐器听起来有一差异,一听就能判断是什么乐器,主要是什么特征起的作用?4).常常听说的声音的能量指的是什么?5).如何可视化一段音频?当我们在分析声音时,通常以「短时距原创 2022-02-12 17:56:09 · 7175 阅读 · 0 评论 -
语音处理/语音识别基础(二)- 声音的存储
本文总结声音的存储,对如下问题做出回答。1.声音有哪些属性?2.声音转换成电脑文件(wav/mp3)的过程是怎么样的?3.PCM格式的音频文件和WAV格式文件的内容有什么差异?声音是物体振动产生的声波。声音通过介质(空气、固体、液体)传入到人耳中,带动听小骨振动,经过一系列的神经信号传递后,被人所感知。声音是一种波。物体振动时会使介质(如空气)产生疏密变化,从而形成疏密相间的纵波。频率(音调):声音1秒内周期性变化的次数人耳的听觉范围在20Hz-20kHz。 低频的声音沉原创 2021-12-26 18:00:15 · 6512 阅读 · 0 评论 -
OpenFST 示例 & Mac 编译安装 - 需要 Python >= 2.1.0 的错误消息处理
Openfst 广泛应用于语音识别,语音合成,机器翻译,手写文字识别,模式识别,字符串处理,机器学习,信息提取和检索等等领域。原创 2021-11-23 13:52:32 · 3044 阅读 · 4 评论 -
语音处理/语音识别基础(一)- 声音到底为何可以存储和播放?
最近准备做几个语音的应用。 心中有很多的疑问, 翻阅了大量资料和图书,找到了这些问题的答案。 如果你也对这些问题好奇,这一系列的文章正是为你准备的。声音是如何产生的? 声音是如何转变成数字信号存储在电脑上的?麦克风是如何工作的? 最早的录音设备是谁发明的?是如何发现的? 机器上的音频文件比如 pcm, wav, mp3文件中到底存储了什么样的内容, 里面的数字表示的什么含义? pcm, wav 存储的内容有什么差异? mp3 文件跟 wav 文件的内容有什么差异? 声音文件(mp3/wav等.原创 2021-11-23 10:25:04 · 4899 阅读 · 0 评论