语音分帧后的重组还原

最新推荐文章于 2023-12-26 01:46:06 发布

非典型废言

最新推荐文章于 2023-12-26 01:46:06 发布

阅读量2.7k

点赞数 3

分类专栏：语音信号处理

本文链接：https://blog.csdn.net/sinat_35821976/article/details/105748495

版权

语音信号处理专栏收录该内容

54 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

本文介绍了语音处理中的分帧技术，详述了分帧过程中帧长、重叠长度和帧移的概念，并探讨了如何在处理后重组语音，避免重复并减少丢弃的数据对结果的影响。通过stft处理的示例，展示了重组语音的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们在对语音信号进行处理的时候经常需要对语音进行分帧，而在分帧的过程中帧与帧之间会有一些重叠部分。在对每一帧处理之后我们需要将语音还原成原来的形式。下面详细说明语音分帧过程及如何还原重组语音。

如下图所示，在分帧过程中，帧长为len_，重叠长度为len1, 帧移为len2。在对语音信号处理后，我们会得到一个帧长为len_的处理后的语音帧，如果我们将这个整个帧重组原始语音的话，在处理后的第二帧里面有部分与第一帧重叠。为了避免这种重复带来的问题，如果语音长度恰好可以将帧长整除，我们在重组语音过程中每次只写入长度为len2的语音，即填充黄色区域对应的数据即可，其实可以发现语音帧有部分被丢弃了，这部分占很少的一部分对语音处理影响不大。

下面以stft处理为例给出代码：


import librosa
from basic_functions import *

x, fs = librosa.load("D:\\Samples\\1.wav", sr=8000)
k = 0
nfft = 512
len_ = 240   # 帧长
len1 &

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

非典型废言

关注关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

基于MATLAB的信号分帧与还原方法——重叠存储法

TechWhizKid的博客

09-11

393

在数字信号处理中，信号分帧与还原是一种常用的技术，用于将连续的信号分割成短时段的帧，以便于对每个帧进行独立处理。重叠存储法是一种常见的信号分帧与还原方法，本文将介绍如何使用MATLAB实现该方法，并提供相应的源代码。（3）初始化一个大小为（frame_length * num_frames）的矩阵（frame_matrix）用于存储分帧后的信号。通过运行上述示例代码，我们可以观察到原始信号和还原信号的波形图，并对信号进行分帧与还原的效果进行比较。基于MATLAB的信号分帧与还原方法——重叠存储法。

点云从入门到精通技术详解100篇-三维点云帧间编码

getusushu的博客

09-11

299

信息以及三通道的颜色信息或者单通道的反射率信息等，导致点云的数据量非常庞大，帧静态点云模型通常包含数万到数千万个点，并且每个点通常包含三通道的几何坐标。热门的研究领域之一，制订点云压缩的通用标准也成为了学术界和工业界的重要研究。近年来，随着三维感测和三维重建技术的快速发展，点云数据的相关应用呈爆发。点云是三维空间中的离散点集，这些点包含了用于表示位置坐标的几何信息和用。主要对人眼感知点云和机器感知点云两类数据集进行压缩，人眼感知点云和机。其目标是致力于压缩各种类别的点云，共包括静态点云（记为类别。

参与评论您还未登录，请先登录后发表或查看评论

python编程实现语音数据分帧及分帧还原

qq_44420246的博客

03-13

3832

主要功能本文主要实现使用python编程实现对我上一个博客写的python编程读取wav文件数据得到的语音数据进行分帧，同时也编程实现将分帧后的数据还原为原始语音数据。第一部分主要实现用python编程实现对语音数据进行分帧。第二部分实现将分帧后的数据还原成原始语音数据，语音数据为单声道的。输入输出数据文件均从命令行输入，分帧的帧长和帧移也从命令行输入。附件包含两个程序，一个是语音数据分...

语音信号的分帧与合成

qq_42719311的博客

04-25

477

语音信号做分帧处理，合成处理。

语音加窗分帧处理

热门推荐

AI.PLAY

03-31

1万+

分帧加窗处理预加重为了消除发声过程中，声带和嘴唇造成的效应，来补偿语音信号受到发音系统所压抑的高频部分。并且能突显高频的共振峰。简单理解就是在频域上面都乘以一个系数，这个系数跟频率成正相关，所以高频的幅值会有所提升。分帧（chunk）傅里叶变换要求输入的信号的平稳的。语音信号在宏观上是不平稳的，在微观上是平稳的，具有短时平稳性（10---30ms内可以认为...

python 语音数据进行分帧

luolinll1212的专栏

08-09

3424

# -*- coding: utf-8 -*- from scipy.io import wavfile import numpy as np fs, data = wavfile.read(r'./bluesky3.wav') nx = len(data) wlen = 200 inc = 80 nframe = int((nx - wlen + inc) / inc) # 计算帧数...

基于C的音频文件的分帧加窗以及数据恢复

Ivy9808的博客

04-06

976

要求：按照行业内常用的分帧设置（帧长320，帧移160）进行分帧后，使用汉明窗，之后将数据通过重叠相加进行数据恢复，对比原文件与恢复后文件语谱图是否一致。此次编写过程中遇到了以下几个问题： 1、之前编写代码时，为了容易理清逻辑，尤其是数组的操作，在有多步数据传递时会声明多个数组，这样编写降低了代码的可读性，因此在声明数组的时候除了in_array[]和out_array[]之外，可定义tmp_array[]存放过程数据，尽量减少数组的数量。 2、此次使用的是汉明窗，对于320个点的汉明窗是固定的一条曲线，

基于 jrtplib 接受 rtp数据重组rtp 还原 rtp上的音视频数据

10-30

在这个场景中，我们将深入探讨如何基于`jrtplib`库接收RTP数据，重组这些数据，并最终还原RTP上的音视频流。首先，RTP通常与RTCP（实时传输控制协议）一起使用，以确保数据的可靠传输和质量反馈。`jrtplib`库提供...

GSM中的效率与安全平衡术：TDMA超帧与数据传输的深度剖析

本文对GSM技术进行了全面概述，重点关注了TDMA（时分多址）技术的基本原理和超帧结构，深入探讨了数据在TDMA超帧中的传输机制。通过分析数据封装与解封装过程、信道分配策略和同步与纠错技术，本文阐释了如何在TDMA...

【幅度调制】基于matlab GUI语音幅度调制【含Matlab源码 292期】

订阅付费专栏Matlab（奶茶价版），可赠送奶茶价版付费专栏指定代码1份；

02-13

1310

语音幅度调制完整的代码，方可运行；可提供运行操作视频！适合小白！

语音信号的合成及其matlab_GUI实现

02-08

本文介绍了利用matlab软件及其中的图形用户界面(GUI)实现驱动声卡采集语音信号和语音信号采集后的文档处理方法，并通过实例利用matlab分析了语音信号处理的过程。

语音分帧函数

07-16

使用matlab进行语音类分帧处理函数，是.M文件

matlab开发-RecordDisplaySpeech

08-23

matlab开发-RecordDisplaySpeech。记录你自己的演讲文件，用于其他练习。

语音处理的分帧，帧移，加窗，滤波，降噪，合成

Android系统攻城狮

01-09

3591

一、分帧语音数据和视频数据不同，本没有帧的概念，但是为了传输与存储，我们采集的音频数据都是一段一段的。为了程序能够进行批量处理，会根据指定的长度（时间段或者采样数）进行分段，结构化为我们编程的数据结构，这就是分帧。二、帧移由于我们常用的信号处理方法都要求信号是连续的，也就说必须是信号开始到结束，中间不能有断开。然而我们进行采样或者分帧后数据都断开了，所以要在帧与帧之间保留重叠部分数...

语音信号预处理2——滤波、分帧处理及端点检测

qq_42196241的博客

06-02

5766

滤波、分帧、端点检测

音频音频恢复：从丢失的信息中还原