- 博客(28)
- 收藏
- 关注
原创 产生特定分布的随机数(一):均匀分布和高斯分布
在信号处理领域,获取特定分布的随机信号是一个很常见的需求,这里把均匀分布和高斯分布两种随机信号的生成方法记录一下,权当备忘。一、首先是均匀分布,一方面均匀分布是最简单的一种情况,其次,均匀分布是后面产生高斯分布的基础。C代码如下:#include <stdio.h>#include <stdlib.h>#include <time.h> void ...
2018-02-22 11:44:13 4503
原创 7种FFT快速算法评测
整理自一位FFT专家(csdn ID: liangbch)的帖子,原帖链接:http://bbs.csdn.net/topics/80425676 7种FFT算法如下: 1. galois_godel()给出的程序 2. http://community.csdn.net/Expert/topic/4570/4570436.xml?temp=.4977686 中的程序
2018-02-03 00:33:13 14087 1
原创 判断一个整数是否为2的整数次幂
这个貌似简单的问题,用处其实蛮大的,比如我们做信号处理的,FFT是常用的一种工具,而模2算法又是最常见的(模4或者质因子分解等其他算法暂不表),往往就需要判断长度是否为2的整数次幂。这里把看到的两种算法整理在这里备忘。方法一: 简洁法bool power_of_2(int x){//2的整数次幂都是形如1000...000的 return((x > 0) && !(x &
2018-02-02 23:23:19 1387
原创 无符号数计算非零比特数量的多种版本C代码汇总
本文首先基于http://www.cnblogs.com/graphics/archive/2010/06/21/1752421.html这篇博文,并在此基础上增加了一个方法。问题描述任意给定一个32位无符号整数n,求n的二进制表示中1的个数,比如n = 5(0101)时,返回2,n = 15(1111)时,返回4这也是一道比较经典的题目了,相信不少人面试的时候可能遇到过这
2017-02-07 20:52:03 1508 1
转载 唤醒系统详解
Wake-Up-Word systemThe concepts of WUW have been most recently expanded in (Këpuska & Klein, 2009). Currently, the system is implemented in C++ as well as Objective C, and provides four major co
2017-01-25 11:11:05 2117
转载 FFmpeg 获取h264裸码流
原帖链接如下:http://blog.csdn.net/ren65432/article/details/43449391有时候我们需要获取h264裸码流进行分析。本文介绍如何通过FFmpeg 获取h264 码流。获取到的h264码流文件 可以直接通过vlc 等播放器直接播放。一、 .h264文件数据流如下图 是通过WinHex工具 分析的一个.h264文件数据:
2017-01-13 10:26:08 8065
原创 TS流之PES语法简介
一、码流语法 TS流能够被正确解析、解码,要求包含正确的PAT、PMT和PES包,PAT和PMT的解析见前一篇博文,这篇简单备忘一下PES的语法。下图是PES包的结构示意图:
2017-01-12 22:06:56 1056
转载 TS格式解析
TS格式解析by ahuner1.TS格式介绍 TS:全称为MPEG2-TS。TS即"Transport Stream"的缩写。它是分包发送的,每一个包长为188字节(还有192和204个字节的包)。包的结构为,包头为4个字节(第一个字节为0x47),负载为184个字节。在TS流里可以填入很多类型的数据,如视频、音频、自定义信息等。MPEG2-TS主要应用于实时传送的节
2017-01-12 21:14:10 454
转载 iOS实现视频录制
本文转载自:http://mostec.cn-hangzhou.aliapp.com注:原文中音频部分没有解释,本文会把音频部分的解释补充上去。pixelbuffer上回书说到iOS视频采集并使用AVCaptureMovieFileOutput类进行视频录制,以及使用AVCaptureVideoDataOutput,AVCaptureAudioDataOutput进行音视频流获
2016-12-28 13:20:27 5871 1
转载 How to Play HLS Live Stream using ExoPlayer
ExoPlayer是Google开源出来的一个用于android平台的音视频player,youtube等在线视频平台均使用了这一player。当然,exoplayer在实际使用场景中仍然有需要特别定制的地方,这就需要开发者发挥主观能动性啦。这里转一个介绍exoplayer支持hls的帖子,感觉介绍的还算不错,源贴藏在这里http://www.tothenew.com/blog/how-to-pl
2016-12-27 11:22:37 901
转载 通过CustomIO实现ffmpeg内存输入
Introduction In this short Article I will explain how to use a custom IO-Context with FFmpeg. Although I used an IStream Object the code can be used for other Streams like std::istream. FFmpe
2016-12-27 11:17:05 1302
转载 Ffprobe查看媒体元数据
ffprobe是ffmpeg中提供的一个工具,下载回来源码后直接configue和make之后,就能生成ffprobe,可以很方便地查看媒体内容的file、stream、packet各个层次的元数据。
2016-12-27 11:13:03 5334
转载 ffmpeg支持的codec
D:\ffmpeg7-win32-static\bin>ffmpeg -encoders ffmpeg version N-49044-g89afa63 Copyright (c) 2000-2013 the FFmpeg developers built on Jan 19 2013 20:36:06 with gcc 4.7.2 (GCC) configuration
2016-12-08 14:42:51 6956
转载 FFmpeg参数说明(转自MultiMedia之旅)
一、FFmpeg参数说明1、通用选项-L license-h 帮助-fromats 显示可用的格式,编解码的,协议的。-f fmt 强迫采用格式 fmt-i filename 输入文件-y 覆盖输出文件-t duration 设置纪录时间 hh:mm:ss[.xxx]格式的记录时间也支持-ss position 搜索到指定的时间 [-]h
2016-12-08 14:40:03 421
转载 APE文件格式解析(转自MultiMedia之旅)
一、APE简单介绍APE是Monkey’s Audio提供的一种无损压缩音频格式。与mp3、ogg有损压缩方式不同,庞大的WAV音频文件通过Monkey’Audio软件进行“瘦身”压缩, 压缩比大约为2 ∶ 1(为源文件的60%左右)。由于采用特殊算法,保证音质不受损失,通过解压缩可以得到与源文件一致的品质,即通过Monkey’还原成WAV,还可把APE音频格式刻录成CD保存。而还原后
2016-12-08 14:35:04 3055
转载 MP4大全
1) 什么是MP4?听闻它是一种“容器格式”,那是什么?容器格式允许你将不同种类的多媒体数据流(多为视频流和音频流)合并在一个单一的文件内。多媒体容器格式,就是我们熟知的AVI(.avi), MPEG(.mpg, .mpeg), Matroska(.mkv, .mka), OGM(.ogm), Quicktime(.mov),或Realmedia(.rm, .rmvb).
2016-12-07 11:37:51 4117
原创 如何快速TIMIT数据库
做语音编解码、增强、识别等相关工作等同学们对TIMIT数据应该不陌生,各种paper里常用的语料数据库,但这个数据不方便下载,这里给出一个很方便的下载方法:1、准备下载工具,linux(含Mac)上使用wget,windows上的网页抓取工具就更多了,自己选吧;2、找到TIMIT的链接,当然就在这里了http://www.fon.hum.uva.nl/david/ma_ssp/2007/T
2016-11-18 11:09:06 3049
原创 循环神经网络(RNN, Recurrent Neural Networks)学习笔记:源码分析(一)
前面帖子给出了RNN的基础理论,里面也提到了神牛Mikolov,这个帖子就基于此牛开源出的一个语言建模工具箱(RNN Language Modeling Tookit)进行代码走读,会加速理解RNN算法及利用RNN进行语言建模,代码在github上的链接在这里:https://github.com/mspandit/rnnlm。btw:大致把github上几个RNN的代码看了一遍,感觉还是Miko
2016-11-17 21:16:05 1241
原创 webRTC消噪模块使用的窗
// Hanning window for 4ms 16kHzstatic constfloat kHanning64w128[128] = { 0.00000000000000f,0.02454122852291f, 0.04906767432742f, 0.07356456359967f,0.09801714032956f, 0.12241067
2016-11-15 13:44:10 2110
原创 循环神经网络(RNN, Recurrent Neural Networks)学习笔记:基础理论
RNN(Recurrent Neuron Network)是一种对序列数据建模的神经网络。继Bengio提出基于神经网络的概率语言模型并获得成功之后,Mikolov于2010年提出利用RNN建模语言模型,2012年Sundermeyer提出RNN的改进版本--LSTM。近两年,RNN开始在自然语言处理、图像识别、语音识别等领域迅速得到大量应用。因项目需要,近期重点学习研究了这几类学习模型,DNN、
2016-11-12 23:00:35 30282 2
原创 三维声场(虚拟3D音频)学习总结(1):基本概念
前言:这两年随着VR、IR概念的火爆,三维声场重建也成了向用户提供高逼真度浸入式体验的关键技术点之一。前两年研究过一段时间三维声场重建,大部分看过的paper的总结都陆陆续续遗失了,所以趁手边还剩一点、脑子里还剩一点,赶紧写下来吧,以免完全遗失了。这部分基于对一篇博士论文的学习,链接在此:http://xueshu.baidu.com/s?wd=paperuri%3A%281bad598554fc
2016-11-12 00:14:25 7779
原创 An Experimental Study on Speech Enhancement Based on Deep Neural Networks学习摘要
李锦辉教授是佐治亚理工的终身教授,研究方向主要是DL,其中包含基于DL的噪声消除,在这一领域被看作是经典之一,目前在行业里也有人推荐李教授的这一方法,看起来值得一试。这篇paper主要是提出了基于DNN网络的噪声消除的framework,并且给出了测试结果,当然,从测试结果看,该方法还是优于现有的其它方法的。 图1:基于DNN的消噪算法框架 该算法主要包括训练阶段和增强
2016-11-07 19:47:14 1466
转载 RBM(受限玻尔兹曼机)原理及代码
本文转自http://blog.csdn.net/zdy0_2004/article/details/45798223,虽然源贴也是转载的,转自http://www.cnblogs.com/xiaokangzi/p/4492466.html本文在转载时,加入了本人的一些勘误和补充了缺失的代码,另外,还有一点未搞明白的是,下面所附的源码中使用的函数binomial(1, mean[i
2016-11-07 17:15:01 12084 3
转载 用CMake代替makefile进行跨平台交叉编译
转载自http://www.cnblogs.com/wengzilin/p/4466708.html【原+转】用CMake代替makefile进行跨平台交叉编译 在开始介绍如何使用CMake编译跨平台的静态库之前,先讲讲我在没有使用CMake之前所趟过的坑。因为很多开源的程序,比如png,都是自带编译脚本的。我们可以使用下列脚本来进行编译:
2016-11-07 12:13:50 1037
转载 在 linux 下使用 CMake 构建应用程序
本篇文章转载自http://www.ibm.com/developerworks/cn/linux/l-cn-cmake/CMake 简介CMake 是一个跨平台的自动化建构系统,它使用一个名为 CMakeLists.txt 的文件来描述构建过程,可以产生标准的构建文件,如 Unix 的 Makefile 或Windows Visual C++ 的 projects/workspa
2016-11-07 12:09:04 258
原创 量化交易学习:交易数据自动抓取
题记:一直对量化交易比较感兴趣,想先自学一下,将来如果有机会,能到机构实战就更棒了。去年用matlab做过一个股票下一交易日价格区间的预测算法,至少在股灾前那段时间准确率还行(别笑,预测区间当然不是在正负10%之间),不过受限于自己的本职工作强度太大(苦逼的移动互联网行业),一直没能继续做下去。后面希望能挤时间慢慢做下去,就当是个业余爱好吧。由于自己的本职工作是做音视频的编解码、增
2016-09-25 18:42:40 5847
原创 linux上获取shell脚本所在目录
CUR_PATH=$(cd `dirname $0`;pwd)echo "current cmd path:$CUR_PATH"
2016-09-19 14:08:52 635
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人