音频(语音)开发
文章平均质量分 75
当选人工智能嵌入式端最火的语音识别开发为导向,实际项目为背书,详细介绍嵌入式端音频开发
优惠券已抵扣
余额抵扣
还需支付
¥129.90
¥299.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
心跳包
硕士研究生,嵌入式软件开发,蓝牙,IOT,人工智能方向
展开
-
嵌入式端音频开发系列汇总(持续更新)
系列文章将从四个方面讲解嵌入式音频的开发:基础篇,协议篇,算法篇,实战篇。===========================================================================================当前更新时间:2020年12月07日最新更新文章=========================..原创 2020-12-07 15:06:25 · 6541 阅读 · 0 评论 -
IIS接口详细介绍
1. 概述I2S = Inter-IC Sound = Integrated Interchip Sound = IIS,是飞利浦在1986年定义(1996年修订)的数字音频传输标准,用于数字音频数据在系统内器件之间传输,例如编解码器CODEC、DSP、数字输入/输出接口、ADC、DAC和数字滤波器等。其与IIC无关联。2. 硬件结构IIS是个相对来说简单的接口协议...转载 2020-04-07 11:02:01 · 10217 阅读 · 0 评论 -
PCM接口详细介绍--TDM方式
原文链接:https://blog.csdn.net/weixin_42509369/article/details/835490481. 概述PCM = Pulse Code Modulation 是通过等时间隔(即采样率时钟周期)采样将模拟信号数字化的方法。图为4 bit 采样深度的PCM数据量化示意图:PCM数字音频接口,说明接口传输的音频数据是通过PCM方式采样得到的,区...转载 2020-04-07 11:06:48 · 10501 阅读 · 0 评论 -
详解低延时高音质:回声消除与降噪篇
在实时音频互动场景中,除了我们上一篇讲到的编解码会影响音质与体验,在端上,降噪、回声消除、自动增益模块同样起着重要作用。在本篇内容中我们将主要围绕回声消除和降噪模块,讲讲实时互动场景下的技术挑战,以及我们的解决思路与实践。「文末有个小彩蛋:) 」回声消除的三大算法模块优化在语音通信系统中,回声消除(Echo Cancellation)一直扮演着核心算法的角色。一般来说,回声消除的效果受诸多因素的影响,包括:声学环境,包括反射,混响等;通话设备本身声学设计,包括音腔设计以及器件的非线性失真等.转载 2021-03-24 17:54:33 · 1203 阅读 · 1 评论 -
嵌入式端音频开发(Unisound篇)之 7.4 蜂鸟M配置宏定义
1.GPIO相关宏定义#define GPIO_OUT_DEF_VAL 1 宏定义说明:0:默认输出低电平1:默认输出高电平2.audio相关宏定义#define USER_AUDIO_VOL_LEVEL 5 宏定义说明:用户音量级别分为0-100级#define USER_AUDIO_VOL_MIN 5 宏定义说明最小声音#define USER_AUDIO_VOL_MAX 100 宏定义说明最大声音..原创 2021-11-25 10:27:42 · 2705 阅读 · 0 评论 -
嵌入式端音频开发(Unisound篇)之 7.3 蜂鸟M软件架构
1.基本架构HAL层:提供包括线程调度、内存管理、信号量系统级统一接口,以及Audio、Record、GPIO、Timer、I2C等外设驱动统一接口;UTILS层:提供常用的工具集代码,包括如:事件队列、Ring Buffer、List、状态机、Hash运算、Json解析等,供SDK及应用层使用;SDK层:提供核心功能接口,如:Audio Play、MP3 解码、语音识别等;APP层:语音识别基础业务功能实现,其核心由一个事件调度和状态机构成,将语音识别业务抽象原创 2021-11-22 14:14:44 · 1822 阅读 · 0 评论 -
嵌入式端音频开发(Unisound篇)之 7.2 蜂鸟开发环境搭建
1.环境准备(1)准备好编译链压缩包,博主这里把它解压到“/opt”目录下root@ubuntu:/home/zhangx/smbshare# tar -xzvf Andestech.tart.gz -C /opt编译链目录如下(2)源码博主这里把源码放在了smbar目录下(3)如果你的编译链没有放在“opt”目录下,就需要修下makefile(build文件夹下)(4)安装linux下环境之python 环境sudo apt-ge...原创 2021-11-22 11:24:16 · 3048 阅读 · 0 评论 -
嵌入式端音频开发(Unisound篇)之 7.1 蜂鸟M离线语音芯片简介
离线语音芯片蜂鸟M简介 云知声总部位于北京,在上海、深圳、厦门设有全资子公司。是一家专注物联网人工智能服务、拥有完全自主知识产权的世界顶尖的智能语音识别和语义理解技术的高新技术企业。自2012年由智能语音技术起家,云知声多年来不断拓展技术边界,技术能力不仅涵盖了感知、认知、交互等方面的人工智能语音语义技术,更是在突破了 AI 芯片...原创 2021-11-20 14:46:25 · 5951 阅读 · 0 评论 -
嵌入式端音频开发(协议篇)之 2.2 ITU Speech Codec(G系列)介绍
一、G.711音频协议二、G.722.1音频协议三、G.722.2音频协议四、G.723.1音频协议五、G.726音频协议六、G.729音频协议原创 2021-05-24 14:38:43 · 595 阅读 · 0 评论 -
嵌入式端音频开发(sensory篇)之 6.4 使用sensory的开发常见的问题
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)查看全文:嵌入式端音频开发(sensory篇)之 6.4 使用sensory的开发必要常见的问题===================================================================版权归作者所有,未经允许,请勿转载。====================================================================一、SDK是线程安全的..原创 2021-04-01 09:48:00 · 524 阅读 · 0 评论 -
嵌入式端音频开发(sensory篇)之 6.3 超详细的TrulyHandsfree命令行工具使用方法
查看本文全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================前言开发任务模型如下:audio-check 是短语识别中检测音频质量的工具live-enroll 是现场音.原创 2021-03-23 16:32:32 · 450 阅读 · 0 评论 -
嵌入式端音频开发(sensory篇)之 6.2 sensory TrulyHandsfree windows下环境安装和linux下环境安装
一、C sample code路径:sample/c/目录:原创 2021-03-23 11:00:51 · 433 阅读 · 0 评论 -
嵌入式端音频开发(sensory篇)之 6.1 语音识别引擎sensory的优缺点
一、优点1、去噪能力极强可在环境噪声很大的条件下使用,可以在手机播放音乐的同时进行语音识别。2、唤醒速度很快相比其他引擎,唤醒速度最快;支持语音验证,即只有本人的语音可以唤醒;3、个人语音识别可以进行语音验证,可以判断不同人的语音。在语音唤醒、命令词情况下,不同的人有不同的结果。4、错误率很低错误标准包括三个方面:1、FR(False Reject):即说了正确的唤醒词但是没有成功唤醒的概率;低于8%2、FA(False Accept):说了错误的唤醒词,原创 2021-03-22 16:45:44 · 715 阅读 · 0 评论 -
嵌入式端音频开发(FFmpeg篇)之 5.3 FFmpeg源码下载和Linux环境下的安装应用
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)查看全文:嵌入式端音频开发(FFmpeg篇)之 5.3 FFmpeg源码下载和Linux环境下的安装应用===================================================================版权归作者所有,未经允许,请勿转载。====================================================================...原创 2021-03-04 10:44:58 · 532 阅读 · 2 评论 -
嵌入式端音频开发(FFmpeg篇)之 5.2 FFmpeg源码下载和windows环境下的安装应用
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================一、下载FFmpeg源码点击下载,它包含了libavcodec, libavutil, libavform...原创 2021-02-09 09:07:46 · 484 阅读 · 0 评论 -
嵌入式端音频开发(FFmpeg篇)之 5.1 学习FFmpeg的资源集合(持续更新)
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================学习Fmpeg的资源:FFmpeg官方文档:http://ffmpeg.org/documentation.html原创 2021-02-08 14:47:33 · 677 阅读 · 0 评论 -
嵌入式端音频开发(实战篇)之 4.5 codec芯片ES8311驱动开发(2)
六、代码es8311.c6.7es8311_config_formatint es8311_config_format(media_hal_codec_mode_t mode, media_hal_format_t fmt){ int ret = 0; uint8_t dac_iface = es8311_read_reg(ES8311_SDPIN_REG09); uint8_t adc_iface = es8311_read_reg(ES8311_SDPOUT_RE.原创 2021-02-01 16:54:20 · 3604 阅读 · 10 评论 -
嵌入式端音频开发(实战篇)之 4.4 codec芯片ES8311驱动开发(1)
一、ES8311简介系统•高性能和低功耗多比特delta-sigma音频ADC和DAC•I2S/PCM主或从串行数据端口•256/384Fs, USB 12/24 MHz和其他非标准音频系统时钟•I2C接口ADC•24位,8至96khz采样频率•100db信噪比,-93 dB THD + N•一对模拟输入差分输入选项•低噪声前置放大器•降噪滤波器•自动电平控制(ALC)和噪声门•支持模拟和数字麦克风DAC•24位,8至96khz采样频率•110分贝的信噪比..原创 2021-01-29 18:28:45 · 7478 阅读 · 6 评论 -
嵌入式端音频开发(实战篇)之 4.3 把音频bin文件生成数组(内含代码)
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)查看本文全部内容:嵌入式端音频开发(实战篇)之 4.3 把音频bin文件生成数组(内含代码)付费用户可以直接copy下面的讲述的内容。====================================================================版权归作者所有,未经允许,请勿转载。=============================================================.原创 2021-01-23 16:55:54 · 784 阅读 · 1 评论 -
嵌入式端音频开发(实战篇)之 4.2 把很多音频合成一个bin文件并统计每个音频文件的大小的方法(内含转换脚本)
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================在实际开发中,我们回需要把一些音频语料转换为bin,文件然后烧写到flash中,并根据每个文件的大小,确定flash中地址的.原创 2021-01-19 17:14:53 · 961 阅读 · 0 评论 -
嵌入式端音频开发(协议篇)之 2.1 S/PDIF协议
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================一、什么是S/PDIFS/PDIF(Sony/Philips Digital InterFace索尼和飞利浦数字接口的英原创 2021-05-14 16:05:34 · 1203 阅读 · 0 评论 -
嵌入式端音频开发(基础篇)之2021-2022年国内主流语音识别芯片科普(1)
前言随着造芯技术越来越精密,AIOT在时代的步伐中不断迈进,语音识别芯片我作为AIOT的入口选择,其地位在智能硬件中变的越来越重要。国内各个语音头部公司、专业的音频/语音公司,不断的出现在造芯这个赛道上。下面就为大家科普下当前市面主要流行的一些语音识别芯片。以下排名不分先后。1.云知声蜂鸟具体资料可以去云知声UniOS平台查看。芯片简介蜂鸟芯片(US526U5/US527U5 )(是云知声最新一代专门为离在线远场语音交互场景设计的高性能,高集成度, 低成本的智能语...原创 2021-12-11 20:37:25 · 18221 阅读 · 4 评论 -
嵌入式端音频开发(基础篇)之 1.6 音频采集的重要武器-麦克风
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================麦克风在音频采集中占据着重要地位,麦克风有哪些种类,哪些参数,根据项目的不通哪些选型标准,下面就来了解下这些知识点。...原创 2021-02-01 18:10:01 · 1146 阅读 · 0 评论 -
嵌入式端音频开发(基础篇)之 1.5 opus应用指南
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================一、opus编解码简介Opus是一个完全开放,免版税,高度通用的音频编解码器。在互联网上Opus是交互式语音和音乐传输,也原创 2021-01-18 09:34:04 · 1010 阅读 · 0 评论 -
嵌入式端音频开发(基础篇)之 1.4 PCM应用指南
这里写自定义目录标题一、 什么是PCM?二、PCM的实现过程三、PCM硬件接口四、PCM软件接口欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入一、 什么是PCM?英文全称:Pulse Co原创 2020-12-23 10:45:18 · 1156 阅读 · 0 评论 -
嵌入式端音频开发(实战篇)之 4.1 如何排查波波音和解决方案
现象:音频播放完后,会有爆破音也就是波波音,示波器测到播放完突起的电平变化。根据经验,判断是硬件问题。下面还是继续分析下问题。1.首先排查是硬件问题还是软件问题?方法:播放一段静音数据,然后不停的开关功放,注意不要随便去调节音量,正常就好。case 1:有爆破音,说明是硬件问题,软件无法规避,一定要硬件解决case 2:没有爆破音,软件去规避。2.case 1解决方案硬件电路增加滤波处理,软件增加mute控制,简单的说就是数据连接到 功放线路上增加一个三极管,进行软件mute控制原创 2020-12-08 11:46:50 · 798 阅读 · 0 评论 -
嵌入式端音频开发(基础篇)之 1.3 用实际项目中的代码带你认识音频开发中最常见的一些名词
查看本文全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================这是某个芯片上的一个音频编码API函数int octopus_encode(spl_opus_encoder_h *st,原创 2020-12-22 20:16:12 · 1081 阅读 · 0 评论 -
嵌入式端音频开发(基础篇)之 1.2 音频开发的主要应用场景
查看本系列全部文章请点击:嵌入式端音频开发系列汇总(持续更新)====================================================================版权归作者所有,未经允许,请勿转载。====================================================================待更新。。。...原创 2020-12-08 23:32:52 · 2043 阅读 · 0 评论 -
嵌入式端音频开发(基础篇)之 1.1 人工智能音频技术助力抗疫
2020年初的疫情爆发,各种无接触测体温,无人快递车,送餐机器等等,让嵌入式端的开发人才供不应求,视频、音频技术,在这些人工智能产品中,占据了重要的位置。远程办公,远程视频,武汉火神山医院5G远程诊断平台,是不是到处凑充满了音频技术,语音的实时性,无损性,变得尤为重要。C语音一度属于占据编程排行榜第一,智能硬件更火了。抛开套路,直接进入主题。目前最火的人工智能入口当属语音技术,估计很多人分不清什么是语音技术?什么是音频技术?什么是语音开发?什么是音频开发?带着疑问,我们开始整个系列.原创 2020-12-08 23:11:55 · 1829 阅读 · 3 评论