asr语音转写_python 腾讯/百度/讯飞 ASR 语音转文字

本文介绍了如何使用Python将微信中的语音转换为文本,涉及了ffmpeg工具进行MP3到WAV的转换,并分别演示了通过百度、讯飞和腾讯的ASR API进行语音转文字的实现过程。
摘要由CSDN通过智能技术生成

因为项目中有需要把微信里的语音转成文本处理, 本次只说语音转文本。

需要注意的是平台对语音的格式有要求, 所以我们需要对语音进行转换格式。

语音转换

使用的工具是ffmpeg, ffmpeg的安装和配置请自行百度。

import os

import tempfile

import subprocess

import base64

import logging

logger = logging.getLogger(__name__)

def mp3_2_wav(_path = None, _byte = None):

''' MP3转WAV

_path和_byte必须存在一个, 优先级_path > _byte

:param _path:

:param _byte:

:return: wav的字节流

'''

try:

if _path is None and _byte is None: return

temp = None

if _path is None: # 字节流存入临时文件

temp = tempfile.NamedTemporaryFile(mode="w+b", delete=False)

temp.write(_byte)

temp.seek(0)

_path = temp.name

if _path is None: return

# 根据要求进行格式转换,-t 60 最大保存60秒, 采样率 16K, 默认单声道

logger.info('mp3 ==> wav ========================')

target_file = tempfile.NamedTemporaryFile(mode="w+b", delete=False, suffix='.wav')

_perfix = r'ffmpeg'

command = [_perfix, '-y', '-t', '60', '-i', _path, '-ar', &

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值