自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 产生特定分布的随机数(一):均匀分布和高斯分布

在信号处理领域,获取特定分布的随机信号是一个很常见的需求,这里把均匀分布和高斯分布两种随机信号的生成方法记录一下,权当备忘。一、首先是均匀分布,一方面均匀分布是最简单的一种情况,其次,均匀分布是后面产生高斯分布的基础。C代码如下:#include <stdio.h&am...

2018-02-22 11:44:13 2029 0

原创 7种FFT快速算法评测

整理自一位FFT专家(csdn ID: liangbch)的帖子,原帖链接:http://bbs.csdn.net/topics/80425676   7种FFT算法如下:   1. galois_godel()给出的程序   2. http://community.csdn.net/E...

2018-02-03 00:33:13 7830 0

原创 判断一个整数是否为2的整数次幂

这个貌似简单的问题,用处其实蛮大的,比如我们做信号处理的,FFT是常用的一种工具,而模2算法又是最常见的(模4或者质因子分解等其他算法暂不表),往往就需要判断长度是否为2的整数次幂。这里把看到的两种算法整理在这里备忘。 方法一: 简洁法 bool power_of_2(int x) { /...

2018-02-02 23:23:19 903 0

原创 无符号数计算非零比特数量的多种版本C代码汇总

本文首先基于http://www.cnblogs.com/graphics/archive/2010/06/21/1752421.html这篇博文,并在此基础上增加了一个方法。 问题描述 任意给定一个32位无符号整数n,求n的二进制表示中1的个数,比如n = 5(0101)时,返回...

2017-02-07 20:52:03 1106 1

转载 唤醒系统详解

Wake-Up-Word system The concepts of WUW have been most recently expanded in (Këpuska & Klein, 2009). Currently, the system is implemented in...

2017-01-25 11:11:05 1395 0

转载 FFmpeg 获取h264裸码流

原帖链接如下:http://blog.csdn.net/ren65432/article/details/43449391 有时候我们需要获取h264裸码流进行分析。本文介绍如何通过FFmpeg 获取h264 码流。获取到的h264码流文件 可以直接通过vlc 等播放器直接播放。 一、...

2017-01-13 10:26:08 5571 0

原创 TS流之PES语法简介

一、码流语法     TS流能够被正确解析、解码,要求包含正确的PAT、PMT和PES包,PAT和PMT的解析见前一篇博文,这篇简单备忘一下PES的语法。 下图是PES包的结构示意图:

2017-01-12 22:06:56 421 0

转载 TS格式解析

TS格式解析 by ahuner 1.TS格式介绍    TS:全称为MPEG2-TS。TS即"Transport Stream"的缩写。它是分包发送的,每一个包长为188字节(还有192和204个字节的包)。包的结构为,包头为4个字节(第一个字节为0x47)...

2017-01-12 21:14:10 272 0

转载 iOS实现视频录制

本文转载自:http://mostec.cn-hangzhou.aliapp.com 注:原文中音频部分没有解释,本文会把音频部分的解释补充上去。 pixelbuffer 上回书说到iOS视频采集并使用AVCaptureMovieFileOutput类进行视频录制,以及使用AVCap...

2016-12-28 13:20:27 4085 0

转载 How to Play HLS Live Stream using ExoPlayer

ExoPlayer是Google开源出来的一个用于android平台的音视频player,youtube等在线视频平台均使用了这一player。当然,exoplayer在实际使用场景中仍然有需要特别定制的地方,这就需要开发者发挥主观能动性啦。这里转一个介绍exoplayer支持hls的帖子,感觉介...

2016-12-27 11:22:37 667 0

转载 通过CustomIO实现ffmpeg内存输入

Introduction  In this short Article I will explain how to use a custom IO-Context with FFmpeg. Although I used an IStream Object the code can be u...

2016-12-27 11:17:05 777 0

转载 Ffprobe查看媒体元数据

ffprobe是ffmpeg中提供的一个工具,下载回来源码后直接configue和make之后,就能生成ffprobe,可以很方便地查看媒体内容的file、stream、packet各个层次的元数据。

2016-12-27 11:13:03 3824 0

转载 ffmpeg支持的codec

D:\ffmpeg7-win32-static\bin>ffmpeg -encoders   ffmpeg version N-49044-g89afa63 Copyright (c) 2000-2013 the FFmpeg developers     built on Jan 19...

2016-12-08 14:42:51 4086 0

转载 FFmpeg参数说明(转自MultiMedia之旅)

一、FFmpeg参数说明 1、通用选项 -L license -h 帮助 -fromats 显示可用的格式,编解码的,协议的。 -f fmt 强迫采用格式 fmt -i filename 输入文件 -y 覆盖输出文件 -t duration 设置纪录时间 h...

2016-12-08 14:40:03 291 0

转载 APE文件格式解析(转自MultiMedia之旅)

一、APE简单介绍 APE是Monkey’s Audio提供的一种无损压缩音频格式。与mp3、ogg有损压缩方式不同,庞大的WAV音频文件通过Monkey’Audio软件进行“瘦身”压缩, 压缩比大约为2 ∶ 1(为源文件的60%左右)。由于采用特殊算法,保证音质不受损失,通过解压缩可以...

2016-12-08 14:35:04 817 0

转载 MP4大全

1) 什么是MP4?听闻它是一种“容器格式”,那是什么? 容器格式允许你将不同种类的多媒体数据流(多为视频流和音频流)合并在一个单一的文件内。 多媒体容器格式,就是我们熟知的AVI(.avi), MPEG(.mpg, .mpeg), Matroska(.mkv, .mka), OGM(.ogm...

2016-12-07 11:37:51 3443 0

原创 如何快速TIMIT数据库

做语音编解码、增强、识别等相关工作等同学们对TIMIT数据应该不陌生,各种paper里常用的语料数据库,但这个数据不方便下载,这里给出一个很方便的下载方法: 1、准备下载工具,linux(含Mac)上使用wget,windows上的网页抓取工具就更多了,自己选吧; 2、找到TIMIT的链接,当...

2016-11-18 11:09:06 2491 0

原创 循环神经网络(RNN, Recurrent Neural Networks)学习笔记:源码分析(一)

前面帖子给出了RNN的基础理论,里面也提到了神牛Mikolov,这个帖子就基于此牛开源出的一个语言建模工具箱(RNN Language Modeling Tookit)进行代码走读,会加速理解RNN算法及利用RNN进行语言建模,代码在github上的链接在这里:https://github.com...

2016-11-17 21:16:05 923 0

原创 webRTC消噪模块使用的窗

// Hanning window for 4ms 16kHz static const float kHanning64w128[128] = {   0.00000000000000f, 0.02454122852291f, 0.04906767432742f,   ...

2016-11-15 13:44:10 1433 0

原创 循环神经网络(RNN, Recurrent Neural Networks)学习笔记:基础理论

RNN(Recurrent Neuron Network)是一种对序列数据建模的神经网络。继Bengio提出基于神经网络的概率语言模型并获得成功之后,Mikolov于2010年提出利用RNN建模语言模型,2012年Sundermeyer提出RNN的改进版本--LSTM。近两年,RNN开始在自然语言...

2016-11-12 23:00:35 27064 1

原创 三维声场(虚拟3D音频)学习总结(1):基本概念

前言:这两年随着VR、IR概念的火爆,三维声场重建也成了向用户提供高逼真度浸入式体验的关键技术点之一。前两年研究过一段时间三维声场重建,大部分看过的paper的总结都陆陆续续遗失了,所以趁手边还剩一点、脑子里还剩一点,赶紧写下来吧,以免完全遗失了。这部分基于对一篇博士论文的学习,链接在此:http...

2016-11-12 00:14:25 3858 0

原创 An Experimental Study on Speech Enhancement Based on Deep Neural Networks学习摘要

李锦辉教授是佐治亚理工的终身教授,研究方向主要是DL,其中包含基于DL的噪声消除,在这一领域被看作是经典之一,目前在行业里也有人推荐李教授的这一方法,看起来值得一试。 这篇paper主要是提出了基于DNN网络的噪声消除的framework,并且给出了测试结果,当然,从测试结果看,该方法还是优于现...

2016-11-07 19:47:14 876 0

转载 RBM(受限玻尔兹曼机)原理及代码

本文转自http://blog.csdn.net/zdy0_2004/article/details/45798223,虽然源贴也是转载的,转自http://www.cnblogs.com/xiaokangzi/p/4492466.html 本文在转载时,加入了本人的一些勘误和补充了缺失的代...

2016-11-07 17:15:01 9542 3

转载 用CMake代替makefile进行跨平台交叉编译

转载自http://www.cnblogs.com/wengzilin/p/4466708.html 【原+转】用CMake代替makefile进行跨平台交叉编译   在开始介绍如何使用CMake编译跨平台的静态库之前,先讲讲我在没有使用CMake之前所趟过的坑。因...

2016-11-07 12:13:50 706 0

转载 在 linux 下使用 CMake 构建应用程序

本篇文章转载自http://www.ibm.com/developerworks/cn/linux/l-cn-cmake/ CMake 简介 CMake 是一个跨平台的自动化建构系统,它使用一个名为 CMakeLists.txt 的文件来描述构建过程,可以产生标准的构建文件,如 Uni...

2016-11-07 12:09:04 197 0

原创 量化交易学习:交易数据自动抓取

     题记:一直对量化交易比较感兴趣,想先自学一下,将来如果有机会,能到机构实战就更棒了。去年用matlab做过一个股票下一交易日价格区间的预测算法,至少在股灾前那段时间准确率还行(别笑,预测区间当然不是在正负10%之间),不过受限于自己的本职工作强度太大(苦逼的移动互联网行业),一直没...

2016-09-25 18:42:40 4451 0

原创 scp从服务器下载文件到本地或从本地上传文件到服务器

scp user@server:/remote_path/file ~/path/

2016-09-19 15:40:07 29156 0

原创 linux上获取shell脚本所在目录

CUR_PATH=$(cd `dirname $0`; pwd) echo "current cmd path:$CUR_PATH"

2016-09-19 14:08:52 439 0

提示
确定要删除当前文章?
取消 删除