- 博客(10)
- 资源 (3)
- 收藏
- 关注
原创 ARM中的浮点运算
General嵌入式系统中三种可能的浮点数处理方式(转载自StackOverflow)1. Use float instructions if your CPU has a FPU. (fast) 直接使用浮点指令,前提是CPU有一个浮点运算单元。速度最快。2. Have your compiler translate floating point arithmetic to integer ar
2016-09-18 09:21:53 3759
原创 WebRtc中的AEC算法
理论 回声消除器的数学模型图回声消除本质上就是把输出信号和它产生的回声信号之间建立一个回声数学模型,利用开始的数据训练这个模型的参数,怎么训练呢?就是在远端有说话,但近端没有说话的时候,录音应该是静音,即回声完全消除。所以算法就朝着这个方向努力,一旦回声为0,则滤波器收敛。自适应滤波器算法多种多样,但是目前流行的还是最经典的LMS和NLMS,NLMS是LMS的优化 。判断标准:收敛速度快,运算复杂
2016-09-06 16:49:23 29135 4
原创 OpenBlas, Neon & VFP
OpenBlasIn scientific computing, OpenBLAS is an open source implementation of the BLAS (Basic Linear Algebra Subprograms) APIwith many hand-crafted optimizations for specific processor types. It is dev
2016-09-05 12:07:17 2266
原创 VAD算法
VAD算法基于信噪比(snr)的vad基于DNN的vad基于能量Energy的vad基于Decoder的Vad混合DNN和Decoder的Vad基于信噪比的VAD算法首先假设初始时的人是没有说话的,计算12帧初始声音的平均能量作为baseline,这个能量相当于底噪。若进入的一帧的rms大于这个baseline,认为有人声,否则认为无人声。初始时,连续n秒无人声,认为用户没有说话;连续3
2016-09-02 19:04:37 14613 2
原创 Bitmap & Bitset
class Bitmap { public: explicit Bitmap(const int size) : size_(size), num_words_((size + 31) / 32) { words_.resize(size); Reset(); }~Bitmap() {}int size() const { return size_;
2016-09-02 18:42:30 1389
原创 SWIG(Simplified Wrapper and Interface Generator)
SWIG is a software development tool that connects programs written in C and C++ with a variety of high-level programming languages. SWIG is used with different types of target languages including commo
2016-09-02 12:55:42 759
原创 C++中的智能指针
Smart pointersSmart pointers enable automatic, exception-safe, object lifetime management. Defined in header Pointer categories 1. unique_ptr (C++11) smart pointer with unique object ownership semant
2016-09-01 21:30:53 440
原创 Ubuntu上安装Kaldi
什么是Kaldi? Kaldi is a speech recognition toolkit, freely available under the Apache License. 注意,Kaldi仅仅是一个工具包,不是一个语音识别框架,想做语音识别,框架还要自己写。这里有一系列ASR开源软件的比较: https://en.wikipedia.org/wiki/List_of_speech_
2016-09-01 20:08:51 1781
转载 语音专题第三讲,语言模型
语言模型技术广泛应用于语音识别、OCR、机器翻译、输入法等产品上。语言模型建模过程中,包括词典、语料、模型选择,对产品的性能有至关重要的影响。语言模型的建模需要利用复杂的模型公式进行模拟计算,是人工智能领域的关键技术之一。 曹立新,2011年7月毕业于哈尔滨工业大学计算机科学与技术专业,曾任百度语音资深研发工程师。负责百度超大语言模型训练,语音交互技术研发以及语音搜索、语音输入法、语音助手等产品
2016-09-01 10:35:38 3204 1
转载 语音专题第三讲,声学模型
语音技术在近年来开始改变我们的生活和工作方式。对于某些嵌入式设备来说,语音成为了人机交互的主要方式。出现这种趋势的原因,首先是计算能力的不断提升,通用GPU等高计算能力设备的发展,使得训练更复杂、更强大的声学模型(Acoustic Model, AM)变得可能,高性能的嵌入式处理器的出现,使语音识别的终端应用变得可能。 声学模型是人工智能领域的几大基本模型之一,基于深度学习的声学模型发展对于人工智
2016-09-01 10:16:06 14081
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人