AI工程仔
让文档更极简易查、让知识更新鲜、让技术更落地。自用笔记,欢迎交流。
展开
-
Next-gen Kaldi - 概览及安装
关于 Next-gen KaldiNext-gen Kaldi 的发展阶段1、Kaldi+ (2019.10 - 2020.5)2、Next-gen Kaldi (2020.5 - 2021.10)Next-gen Kaldi 的组成安装1、安装 lhotse2、安装 k23、安装 icefall原创 2024-04-24 14:41:53 · 204 阅读 · 3 评论 -
jiwer - 语音识别评估
JiWER 是一个简单快速的 python包,用于评估自动语音识别系统。使用 RapidFuzz 计算最小编辑距离,它在后台使用C++,因此比纯python实现更快。这些度量是通过使用一个或多个参考句和假设句之间的最小编辑距离来计算的。需要 python >= 3.7。2023-04-04(二)方式二:poetry。转载 2023-04-04 14:31:15 · 1117 阅读 · 0 评论 -
ASR - OpenAI whisper
关于 whisperApproachSetup1、安装 whisper2、安装依赖 ffmpeg3、安装依赖 rust可用的模型和语言命令行用法Python usage更多示例参考翻译 2022-10-19 11:09:39 · 2987 阅读 · 0 评论 -
buzz - 基于 whisper 的语音识别客户端(支持macOS、windows、Ubuntu
Features安装如何使用1、实时录制2、录制电脑音频导入文件从源码编译FAQ转载 2023-03-21 11:39:02 · 4245 阅读 · 1 评论 -
NVIDIA NeMo - 实现 ASR/TTS
关于 NVIDIA NeMo通过NeMo快速实现ASR语音识别模型推理0 导入NeMo及asr工具类1.1 加载Quartznet自动语音识别模型1.2 传入音频文件 — 进行语音识别1.3 使用ASR_mertrics工具库对预训练模型识别结果计算准确率训练2 采集数据制作数据集2.1 录制语音文件:2.2 制作数据清单格式要求:2.3 加载数据清单2.4 加载quartznet配置文件2.5 将数据清单传给配置文件3 训练模型3.1 使用迁移学习的方法训练模型3.2模型的转载 2023-03-01 14:44:03 · 1466 阅读 · 1 评论 -
WeNet 2 - Python调用识别和预训练模型
一、关于 WeNet Python Binding安装二、用法1、非流式调用报错处理参数指定2、流式调用三、预训练模型模型列表翻译 2023-02-14 10:27:16 · 1125 阅读 · 0 评论 -
语音识别 - 历史发展
一、模板匹配二、统计模型三、深度学习原创 2023-02-11 19:22:13 · 2378 阅读 · 0 评论 -
WeNet 1 - 初识跑通
关于 WeNet快速上手识别训练环境准备训练原创 2023-02-10 11:44:55 · 1189 阅读 · 1 评论 -
Kaldi - 数据文件准备
数据文件准备wav.scputt2spkspk2utttext相关代码根据文件生成 utt2spk 和 wav.scputt2spk -- spk2utt 转换原创 2023-02-09 18:21:06 · 482 阅读 · 0 评论 -
Kaldi - egs
egs 概览egs 简述yesnoaishellthchs30TIMITlibrispeechwsjvoxforge翻译 2023-02-09 18:00:29 · 212 阅读 · 0 评论 -
ESPnet
关于 ESPnet安装配置运行 yesno原创 2023-01-28 20:21:04 · 881 阅读 · 0 评论 -
Linux/macOS 安装 Kaldi
一、关于 kaldi二、安装1、下载源码2、查看 INSTALL 文件root -- INSTALLtools -- INSTALLsrc -- INSTALL3、处理tools4、处理 src三、测试报错1:Bad FST header报错1:gmm-init-mono: command not found原创 2022-12-16 20:59:45 · 1178 阅读 · 2 评论