语音处理
阿斯永恒
一点一滴,积累不断
展开
-
sox常用命令整理
play *.wav 播放音频 sox *.wav -n stat:查看文件信息 sox *.wav -n stat -v:不失真最大调整量 sox -v 0.8 input.wav output.wav:调整音量0.8,(大于1为扩大) sox *.wav *1.wav trim 0 10:截取0秒开始,10秒长度的音频 sox *.wav sox *.m...原创 2019-01-11 15:52:18 · 7475 阅读 · 1 评论 -
简单的python小程序--语音转频谱图
#!usr/bin/env python# -*- coding:utf-8 _*-"""@author:czc@file: specgram3.py@time: 2018/04/17"""import waveimport numpyimport matplotlib.pyplot as pltfrom PIL import Image wave_...转载 2019-01-11 15:54:32 · 1904 阅读 · 1 评论 -
语音文件常用属性理解
采样率:单位时间对媒体对象的采样次数,单位Hz帧率(fps):单位时间内媒体帧的个数,音频文件每帧的时长为20ms采样率和帧率的区别:人能听到的声音在20ms内的变化可以看做是稳定的,因此可以将音频的帧类比于电影的帧,即每一次静止画面或稳定音频段,帧率就是每次静止音频段刷新的次数 位深度:每一次采样包含的信息的位数帧长:媒体帧的长度(音频一般为20ms)声道数:立体声为双声...原创 2019-01-12 14:49:08 · 463 阅读 · 0 评论