python音频处理获取音高_Python音频帧音高变化

这篇博客探讨了使用Python的PyAudio库和快速傅里叶变换(FFT)来尝试改变音频文件的音调。作者通过读取音频流,将数据转换为numpy数组,然后应用FFT进行处理,试图动态改变音高。尽管遇到了困难,尤其是对音频帧数据类型的不熟悉,但作者仍在努力寻找解决方案。博客内容主要涉及音频处理、信号变换和Python编程。
摘要由CSDN通过智能技术生成

我正在尝试使用pyaudio制作语音掩码.按照我现在设置的方式,我唯一要做的就是输入声音,动态改变音高,然后将其重新排出.第一部分和最后一部分正在发挥作用,我认为我正在接近改变音调……强调“思考”.

不幸的是,我不太熟悉我正在使用的数据类型以及如何以我想要的方式操作它.我已经阅读了audioop文档并且没有找到我需要的东西(想到有些东西我可以肯定地在那里使用).我想我要问的是……

如何在这些音频帧中格式化数据.

如何改变画面的音高(如果可以的话),或者它是否接近这样的工作?

import pyaudio

import sys

import numpy as np

import wave

import audioop

import struct

chunk = 1024

FORMAT = pyaudio.paInt16

CHANNELS = 1

RATE = 41000

RECORD_SECONDS = 5

p = pyaudio.PyAudio()

stream = p.open(format = FORMAT,

channels = CHANNELS,

rate = RATE,

input = True,

output = True,

frames_per_buffer = chunk)

swidth = 2

print "* recording"

while(True):

data = stream.read(chunk)

data = np.array(wave.struct.unpack("%dh"%(len(data)/swidth), data))*2

data = np.fft.rfft(data)

#MANipulation

data = np.fft.irfft(data)

stream.write(data3, chunk)

print "* done"

stream.stop_stream()

stream.close()

p.terminate()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值