音频
文章平均质量分 52
音频、语音转文本相关开发
阳宗德
诚然,程序员应该重视代码,但眼里也不应该只有代码,很多代码之外的东西也很精彩。工作也是为了更好的生活,多看看身边的事,多关心身边的人,终究我们还是要回归到平凡的生活中。
我们所热爱的,就是自己的生活!
展开
-
python文字转语音开源库
Python 文字转语音(TTS,TextToSpeech)有很多库可以实现,例如:pyttsx3gTTSIBM Watson TTSwin32com(Windows 平台)注意:如未安装请先安装,为节省时间,以下我把安装和使用写在一个代码块中了,应该是分开的。# pyttsx3pip install pyttsx3 import pyttsx3 pyttsx3.speak("Hello World")# gTTSpip install gTTS from gtts import gT原创 2021-11-03 09:08:54 · 1688 阅读 · 0 评论 -
vosk文件转写
vosk介绍以及安装,参考地址:https://blog.csdn.net/qq_35385687/article/details/119209189?spm=1001.2014.3001.5501vosk实时语音识别,参考地址:https://blog.csdn.net/qq_35385687/article/details/119357825?spm=1001.2014.3001.5501文章目录命令行模式文件上传方式命令行模式#!/usr/bin/env python3import o.原创 2021-08-03 20:05:15 · 676 阅读 · 0 评论 -
vosk实时语音识别
vosk介绍以及安装,参考地址:https://blog.csdn.net/qq_35385687/article/details/119209189?spm=1001.2014.3001.5501文章目录编写websoket实现实时转写前端获取pcm实时传输至后台完整项目地址编写websoket实现实时转写#!/usr/bin/env python3import argparseimport osimport queueimport sounddevice as sdimport s.原创 2021-08-03 19:59:35 · 4992 阅读 · 8 评论 -
vosk开源语音识别
文章目录简介安装vosk测试相关参考网址简介Vosk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。目前支持 WAV声音文件格式。安装voskpython -m pip install -U vosk直至成功安装,比如:Successfully installed vosk-0.3.10测试Running the example code with pythongit clone https://github原创 2021-07-29 13:38:43 · 8818 阅读 · 0 评论 -
开源离线语音识别(SpeechRecognition)
本次将使用SpeechRecognition和pocketsphinx进行离线语音识别。翻译 2021-07-23 11:23:21 · 11552 阅读 · 4 评论 -
JS实时麦克风录音并通过WebSocket实时传递到后台
JS实时麦克风录音并通过WebSocket将pcm传到后台并处理文章目录JS实时麦克风录音并通过WebSocket将pcm传到后台并处理前端后端websoket接收主要思路前端<html><head> <meta charset="UTF-8"> <title>Simple Recorder.js demo with record, stop and pause</title> <meta name="vie原创 2021-07-20 17:17:03 · 8336 阅读 · 33 评论 -
基于ASRT的开源实时语音转文本
基于ASRT的开源实时语音转文本文章目录基于ASRT的开源实时语音转文本ASRT语音识别系统相关资料实时转写客户端识别效果ASRT语音识别系统相关资料ASRT是AI柠檬博主(西安电子科技大学 · 西安市大数据与视觉智能重点实验室)从2016年起做的开源语音识别项目,相关的多个平台的客户端SDK也已经开源在GitHub和Gitee上。其中,ASRT语音识别API已经为AI柠檬站内搜索引擎提供了语音识别服务,用于该站语音搜索功能的实现。ASRT项目能实现wav语音文件的文字识别,不能实现实时语音转文本,原创 2021-07-20 16:53:34 · 4340 阅读 · 5 评论 -
pcm转wav
PCM相比WAV而言,wav比pcm多44字节文件头。把PCM格式的数据存储成WAV格式数据的思路:先写头部,再写数据块。WAV格式可以分成两个部分:1.文件头,存储一些重要的参数信息,比如采样率,声道数,量化精度等等。2.数据块,原始的PCM数据。想要了解WAV格式的可以点击这里import java.io.ByteArrayOutputStream;import java.io.DataOutputStream;import java.io.FileInputStream;import原创 2021-07-09 10:14:17 · 525 阅读 · 0 评论 -
Java实现pcm与ADpcm互转
文章目录一、概念二、原理三、优缺点四、转换一、概念1、PCM脉冲编码调制(Pulse Code Modulation,PCM),由A.里弗斯于1937年提出的,这一概念为数字通信奠定了基础,60年代它开始应用于市内电话网以扩充容量,使已有音频电缆的大部分芯线的传输容量扩大24~48倍。2、ADPCMADPCM (ADPCM Adaptive Differential Pulse Code Modulation),是一种针对16bit (或者更高) 声音波形数据的一种有损压缩算法,它将声音流中每次采样的原创 2021-07-09 16:32:46 · 1275 阅读 · 6 评论 -
js实现pcm音频转wav与播放
js实现pcm音频转wav与播放<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="ie=edge"> <title>pcmtowav</title></head><body><div> g原创 2021-07-13 13:40:10 · 4519 阅读 · 2 评论