技术-PYTHON
文章平均质量分 66
求真得真
空空如常,求真得真
展开
-
paddlespeech asr脚本demo
paddlespeech是百度飞桨平台的开源工具包,主要用于语音和音频的分析处理,其中包含多个可选模型,提供语音识别、语音合成、说话人验证、关键词识别、音频分类和语音翻译等功能。本文介绍利用ps中的asr功能实现批量处理音频文件的demo。ps的asr功能中有多个模型可选,目前测试中的“conformer_wenetspeech”识别准确率较高。识别速度有待提高,音频长度的限制也待解决。空空如常求真得真。原创 2023-09-14 17:50:03 · 634 阅读 · 0 评论 -
paddlespeech on centos7
paddlespeech是百度飞桨平台的开源工具包,主要用于语音和音频的分析处理,其中包含多个可选模型,提供语音识别、语音合成、说话人验证、关键词识别、音频分类和语音翻译等功能。paddlespeech整体是比较简单易用的,但是安装部署依然有很多坑,本文为探坑而写。paddlespeech提供了语音相关的基础能力,降低了音频模型的使用门槛。在paddlespeech的基础上,完善的产品还需要很多的包装工作和业务开发。空空如常求真得真。原创 2023-09-08 15:09:58 · 669 阅读 · 0 评论 -
vscode无法调试python2.7版本
好久没有用python2.7版本了,最近有个老的脚本要优化,但是发现vscode无法对脚本调试,特此记录下解决方法。本地安装有python2和python3,开发过程中,vscode可以随时调整python版本来适配代码。但是最近发现在vscode上,python3可以正常调试/运行,而python2可以运行,但无法调试,按‘F5‘之后,调试窗口闪了一下就消失了,终端输出中也没有任何消息。在‘bing‘和’baidu‘中搜索无果,都是误导信息。科学上网工具对于提高生产力很有帮助。https。...原创 2022-07-28 17:36:16 · 5257 阅读 · 6 评论 -
wav文件头信息
概述最近在对接百度TTS的python接口,对接的过程中发现一些问题,记录下解决方案。百度TTS接口返回的音频数据格式有4种,分别是mp3,pcm-16k,pcm-8k,wav(pcm-16k)。我们需要的结果是wav(pcm-8k)。需求对齐后,分析解决方案,主要有以下几个选择。mp3转码为wav,比如python库AudioSegment。 wav(pcm-16k)重采样为wav(pcm-8k),比如python库wave。 pcm-8k转换为wav格式,比如pytho...原创 2022-05-13 10:39:36 · 1351 阅读 · 0 评论 -
centos6安装python3
概述官方目前已经不对centos6做维护了,包括yum源也不再更新和维护(centos6可用yum源)。但是线上有一些老的服务器还在跑centos6,所以做个总结记录一下。环境CENTOS6安装步骤依赖库:yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpca原创 2021-09-17 17:56:33 · 1129 阅读 · 0 评论