自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (20)
  • 收藏
  • 关注

原创 MFCC & PLP

这在前一篇博客中提到的语音特征提取的常用方法之一。MFCC对于语音/说话人识别,最常用的声学特征是梅尔导谱系数(mel-scale frequency cepstral coefficient,MFCC)。预加重将信号通过高通滤波器: s2(n)=s(n)−a∗s(n−1)s_2(n)=s(n)-a^{*}s(n-1) 上式中s2s_2是输出,aa是滤波器系数,通常取0.9∼10.9 \sim1

2017-05-30 11:53:18 8648

原创 语音识别概述

语音识别概述语音识别问题就是模式分类问题。 一个基本的语音识别系统如下图,实现是正常工作流程,虚线是训练模式分类问题中的模板(这里就是声学模型,字典和语言模型)。 图1语音识别系统组件关系图 语音识别是把语音声波转换成文字。给定目标语音的训练数据,可以训练一个识别的统计模型。用傅里叶变换将声波变换成频谱和幅度。 基于HMM的传统的声学模型依赖于语音和文本数据,以及一个单词到音素的发音字典

2017-05-30 11:30:35 18739 1

原创 Compute library compile

gsc@X250:~/Downloads$ cd /opt/android-ndk-r14b/gsc@X250:/opt/android-ndk-r14b$ lsbuild ndk-build ndk-gdb ndk-which prebuilt shader-tools source.properties sysrootCHANGELOG.

2017-05-18 10:16:41 2649 1

原创 tensorflow mnist

showing Learning processimport matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npfrom sklearn.metrics import confusion_matrixtf.__version__from tensorflow.examples.tutorials.mnist i

2017-05-16 21:18:23 1171

原创 Ubuntu usefull tools

代码自动补全软件sudo apt-get install vim-addon-manager sudo apt-get install vim-youcompleteme vim-addons install youcompleteme中文支持如果安装的是英文键盘,增加搜狗需要按如下设置:fcitx-config-gtk3添加到右侧 sudo im-co...

2017-05-16 21:09:44 929

原创 麦克风阵列盲源分离技术

麦克风阵列盲源分离技术盲源分离技术仅根据观察到的每一路混叠信号估计原始多路信号,独立成分分析(independent component analysis)卷积混合情况的盲源分离技术。第一部分麦克风数量大于声源数量的ICA的方法,第二部分是麦克风数量小于声源数量的时频分集方法,第三部分是基于最大后验概率的单麦克盲源分离技术。 盲源分离解决的问题:线性模型,又称瞬时模型卷积模型,语音更符合这个模

2017-05-11 20:48:07 14885 9

原创 语音预加重

语音信号预加重元音能量主要集中在1KHz以下,并且以6dB/十倍频的速度下降,可以使用欲加重技术增强高频能量,这在回声消除以及语音识别中的特征提取(共振峰, LPC)中用到,声道的终端是口和唇,口唇辐射对低频影响比较小,但是对高频段影响比较大,欲加重技术技术为了提升高频分辨率,欲加重的传递函数是H(z)=1−aZ−1H(z)=1-aZ^{-1} 。通常欲加重系数aa的取值在0.9<a<10.9<a<

2017-05-05 08:14:03 4733

原创 语音自适应回声消除(AEC)算法

自适应回声消除算法欢迎留言交流AEC算法早期用在Voip,电话这些场景中,自从智能设备诞生后,智能语音设备也要消除自身的音源,这些音源包括音乐或者TTS机器合成声音。本文基于开源算法阐述AEC的原理和实现,基于WebRTC和speex两种算法,文末会附上两种算法的matlab实现。回声消除原理回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:ω\omega 进行参数辨识,根据扬声器信号与产

2017-05-04 11:17:20 64958 33

深度学习之 自然语言处理BERT 博客源码

深度学习之 自然语言处理BERT 博文源码

2022-06-11

深度学习 模型调优 keras mnist

越来越多的人工智能解决方案将深度学习作为其基本技术,然而构建深度学习模型并不是一件容易的事,为了获得满意的准确性和效率,通常需要数周的时间优化模型。 本下载源码为博客文章 https://blog.csdn.net/shichaog/article/details/125128321 配套资源,从网络结构本身和训练参数两个层级两个方面实例分析优化的过程和手段

2022-06-06

语音回声消除使用到的算法

语音回声消除算法中使用到的NLMS算法

2017-05-03

zynq dma linux 配置

该资源是博客中附带的资源下载链接

2017-04-02

bluetooth BLE server

bluedroid bluetooth low energy,server端示例代码,client 端下载地址见: http://blog.csdn.net/shichaog/article/details/53557274

2016-12-12

beacon android示例代码

android下beacon 开发示例程序

2016-12-10

bluetooth BLE client

Gatt为ble client端程序,用于brocast自己并发送一些信息.Server为接收信息程序

2016-12-10

麦克风阵列前端语音信号处理

个人学习笔记,稍稍整理下

2016-10-12

vim 技巧和插件

共六个部分。 第一个部分是vim常用命令快捷方式 第二个是Tlist插件的安装和使用实例。 第三个是ctags的安装和使用实例 第四个是自动补齐功能的实例 第五个是winmanager的安装和使用实例 第六个是cscope安装和使用实例 每个录制文件包含了time_*和vim_*两个文件,其中time文件记录时间,vim命令记录的是命令,它们内容是script工具生成的。 查看演示方法,如查看第二个(time和vim两个文件中去有2的文件): scriptreplay time_hacking2_tlist.log vim_hacking2_tlist.txt 其中在~/.vimrc的文件在vimrc文件里,如果只使用scriptreplay回放,则不需要替换~/.vimrc;如果替换,则先备份原文件,以免习惯不同导致不适应。

2015-05-08

linux内存管理

原创,共五章,基于工作中使用的3.10版本内核,包括 内存启动初始化过程,linux内核内存管理,进程虚拟地址管理

2015-05-05

linux tcp/ip协议栈

分为上篇和下篇,上下篇共十八章,上篇九章部侧重于TCP/IP数据收发流程,即OSI模型的IP和TCP层,下篇也是九章,并不属于TCP/IP本身,但是多少和网络有关且常用到,比如LC-trie路由、netfilter包过滤防火、还有一些网络相关的命令行工具等,文末给出IPV6的协议栈模型图,此外还给出了测试源码。

2015-04-22

Linux系统启动那些事—基于Linux 3.10内核

注:Linux310启动,为旧版本,请下载这版 也许你会好奇Linux是如何启动的?一些基础的服务又是何时准备好的?本文旨在揭秘操作系统是启动过程的,主要是内核态下发生的一些事。本文涉及grub、uboot、initrd、根文件系统、设备树、以及Linux内核编译等内容。 对那些好奇系统是如何启动的人本文非常适合,当然对于由于涉及操作系统的方方面面,bsp的开发人员也有点价值,但是这里没有对应用做介绍;本文讨论两种平台下的启动方式,因为它们均是对应体系架构下的典型。

2014-10-25

ieee802.3-2012

ieee 802.3 -2012标准;全部收录完整版

2014-08-03

keepalive应用脚本

包括主、从MySQL库,监视、主从切换shell脚本

2014-05-05

嵌入式linux应用开发完全手册光盘代码

嵌入式linux应用开发完全手册 那本书里的代码和工具部分韦老的书,很不错

2012-03-04

fft 快速傅里叶变换430

快速傅里叶变换 c语言编写的,fft 快速傅里叶变换C8051FXXX 程序,其中包含8位和16位的快速傅利叶变换

2011-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除