python提取微信聊天语音_GitHub - dennischancs/wechat-asr: 微信语音批量转文字 python编写用百度智能云短语音识别API实现 windows下的使用...

weixin_39916479

于 2020-12-21 22:23:46 发布

阅读量629

点赞数

文章标签： python提取微信聊天语音

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39916479/article/details/111809319

版权

微信语音批量转文字工具，使用Python和百度智能云短语音识别API，适用于Windows和安卓设备。用户需手动提取.amr文件并进行转码，然后通过程序识别为txt，适合大量语音转文字场景。

摘要由CSDN通过智能技术生成

WeChat-ASR

微信语音批量转文字调用百度智能云短语音识别API 目前仅支持安卓手机+Windows

简介

最近线上办公，很多小会议或者讲座等也在微信群里，有时需要记录保存会议讲话内容，也可能为了节省时间，转成文字后快速浏览即可了解会议大致内容。

总之，微信自带的语音转文字虽然方便，但是面对多次的大量语音的时候一个一个点还是太麻烦了。用这个工具，第一次使用稍微有些麻烦，但是以后使用的时候还是会比较方便的。

原理

从手机(只写了安卓系统)找到文件夹，按时间提取需要识别的语音(还需要人工操作)

因为微信语音限制在60s，正好和百度asr限制一样，故不存在截取，准确性更高

用silk_v3_decoder 将微信的.amr文件转码.pcm文件

用百度智能云语音识别的API接口(需要申请账号)

生成txt，带顺序时间标志

运行环境

个人Windows 10+安卓手机可用

详细使用方法(文字版)

解压

从手机取出语音文件

手机连接电脑，并打开传输文件模式

依次访问\内部存储\tencent\MicroMsg\******************************\voice2

详细信息查看方式，并按时间排序

选中需要转码时间段的文件夹(建议从会议起始时间开始，到现在为止的文件夹全部选中)，复制粘贴到电脑

筛选出需要的文件

在电脑上的新文件夹里，在右上的搜索为止搜索.amr

全选文件，复制粘贴到新文件夹

申请百度智能云 API Key 和 Secret Key

左上方产品->人工智能->语音技术->语音识别

左边中间位立即使用

登陆使用百度账号即可，可能需要手机验证

左边中间位置创建应用

应用名称应用类型随便选，接口不用管，语音包名不需要，应用描述随便写点击创建

创建完毕后中间位置点击查看应用详情

可以看到 API Key 和 Secret Key，这两个很重要，每次使用都要填入，建议保存在程序目录里的一个txt里

打开软件(不要管那个黑框框)

填入5里申请的 API Key 和 Secret Key 并连接

点击 '选择 .amr 文件'，打开 4.b 里保存到的文件夹，选中会议时间的文件

可选选择保存位置及名称

开始识别 (因为还不会写多线程，所以程序运行中一直假死，程序运行过程中不要动软件，等到完成时会有弹窗提示)

识别结束打开文件

推荐到word编辑，页面布局为窄，当修订校对完成后，用查找替换删除时间点要开启通配符模式 “\{[0123456789_.pcm]{26,31}\}” (最好将文件保存下以免出现问题)

程序如果出现闪退等情况提交issue，常见解决方法(只能先凑合)在下载的文件中有

已知问题

菜单栏触发范围有问题

没有多线程，程序假死

python打包程序还是有点大

单元格不能复制

程序太丑，没有美化等

从手机中提取出录音文件对于大部分人来说难度还是偏大，第一次上手难度高

个人代码水平太低

会闪退

后记

最初是因为朋友有需求写的，但是没有做图形化界面。后来想着学学吧，就挖坑写了，不过也学了不少东西

应该也有许多人会用到吧，想着慢慢也升级一下，支持从手机直接读取录音文件？支持苹果设备等等，不过还不确定，如果有需求，那我就写写

weixin_39916479

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python提取微信聊天语音_GitHub - dennischancs/wechat-asr: 微信语音批量转文字 python编写用百度智能云短语音识别API实现 windows下的使用...

WeChat-ASR微信语音批量转文字调用百度智能云短语音识别API 目前仅支持安卓手机+Windows简介最近线上办公，很多小会议或者讲座等也在微信群里，有时需要记录保存会议讲话内容，也可能为了节省时间，转成文字后快速浏览即可了解会议大致内容。总之，微信自带的语音转文字虽然方便，但是面对多次的大量语音的时候一个一个点还是太麻烦了。用这个工具，第一次使用稍微有些麻烦，但是以后使用的时候还是会比...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。