![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习笔记
文章平均质量分 58
jinnsjj
这个作者很懒,什么都没留下…
展开
-
SIFT-sift.m
% [image, descriptors, locs] = sift(imageFile)%% This function reads an image and returns its SIFT keypoints.% Input parameters:% imageFile: the file name for the image.%% Returned:%原创 2015-04-16 15:22:11 · 726 阅读 · 0 评论 -
impulse response 使用的踩坑 —— cconv
在 impulse response 的使用中遇到了小小的问题,具体如图,第一行是原始信号,第二行是响应的信号,在通过将原始信号和相应信号分别转换到频域求得 transfer function 后,ifft 得到 impulse response。第三行是原始信号和 ir 进行卷积得到的结果,可以看到在信号最开始的阶段,有一个意料外的响应。:这一段的代码如下:% src: 原始信号% r...原创 2018-10-16 16:07:23 · 5275 阅读 · 1 评论 -
音频重采样 python+librosa
python中的librosa库让我们可以非常方便的对音频文件进行重采样。目标是一个48kHz的音频,利用librosa库中中的resample将这段音频下采样到8kHz。import librosa# to install librosa package# > conda install -c conda-forge librosa filename = 'ClapSound....原创 2018-10-18 12:47:13 · 11109 阅读 · 0 评论 -
librosa.load() 读取音频的采样率处理
利用python中的 librosa.load() 我们可以轻松的读取音频文件,但对于不同采样率的音频文件,使用这一函数有一些细节还需注意。如果 sr 缺省,librosa会默认以22050的采样率读取音频文件,高于该采样率的音频文件会被下采样,低于该采样率的文件会被上采样。如果希望以原始采样率读取音频文件,sr 应当设为 None。具体做法为 y, sr = librosa(filename...原创 2018-10-18 12:45:36 · 22062 阅读 · 2 评论 -
语音情感识别探讨
El Ayadi M, Kamel M S, Karray F. Survey on speech emotion recognition: Features, classification schemes, and databases[J]. Pattern Recognition, 2011, 44(3): 572-587.简介语音识别的发展可以说是非常成熟,但距离我们的目...原创 2018-09-05 15:43:29 · 9657 阅读 · 0 评论 -
HOA声场重建原理
在空间音频尤其是声场重建的任务中,HOA绝对是最为重要的技术之一,但这个HOA涉及到调和分解等一系列概念,理解起来其实并不容易。最近要写一篇基于HOA的声场重建论文,但在background的时候就感到头疼,不知怎么下手,于是借着这篇文章,回头看看HOA,也好梳理一下自己的思路。空间音频是什么?空间音频很多地方也叫做三维音频,它源于我们人据有分辨声音来源方向的能力。虽然一直是比...原创 2018-07-14 23:02:07 · 4314 阅读 · 2 评论 -
NMF非负矩阵分解初探
NMF非负矩阵分解初探NMF非负矩阵分解初探简介NMF信号分解最优化问题NMF简介数据可以表示为一个矩阵 VVV,列 vnvnv_n 是采样点而行代表特征features。我们想把这个矩阵VVV因式分解为两个未知的矩阵 WWW 和 HHHV≈V^≡WHV≈V^≡WH V \approx \hat{V} \equiv WH这里面 WWW 是一个经常性...原创 2018-07-04 17:48:30 · 1092 阅读 · 0 评论 -
堆,堆在C++中用法
Heap堆有最大堆与最小堆,也有对应的push和pop操作。在最大堆中,最大的元素在堆顶,pop会将最大的元素推出, 最小堆则反之。C++中的用法C++中的堆,要基于向量使用。操作基于三个函数std::make_heap,std::push_heap,std::pop_heap,并且要配合push_back与pop_back使用。需要#include <algorithm&g...原创 2018-07-03 15:06:01 · 1159 阅读 · 0 评论 -
用 Keras 建立CNN对 UrbanSound 进行音频分类
Urban Sound Classifier using CNN v2第一个CNN的分类器效果惨烈,有许多细节都没有注意到,感觉修改也令人心烦,从头开始。老实说我也不知道这次能不能成功,边做边看吧。上次踩过的坑和经验之前把频谱当作训练数据输入,但频谱里的数值都是负数,后来换为了绝对值。但这样其实也不行,应该要进行normalization。把是把值的范围限制在[-1,1]还是[0...原创 2018-07-08 18:40:56 · 7570 阅读 · 18 评论 -
HRTF音频处理
HRTF全称叫Head Related Transfer Function,可以看成是一个特定位置的声音传输到左右耳的频率响应,对应的时域响应叫HRIR,Head Related Impulse Response。所以,HRTF其实就是一个滤波器。要得到经HRTF处理的特定位置声音,只需要与HRIR做卷积就好了,或者fft之后与HRTF相乘。MIT、CIPIC的HRTF库给出的dat,原创 2016-01-12 13:32:23 · 6560 阅读 · 4 评论 -
Unity学习日记-使用脚本进行音频资源的读取,Resources.LoadAll
这次过程太过艰辛,在网上搜了很多,然而一个能用的都没有,于是自己硬生生的试了出来,就讲结论吧。 要做的事情是用脚本读取音频文件,其实读取音频文件用GUI是非常简单的,可是,HRTF的数据库动辄几百的音频文件,若要手工,画面太美,而且如果都放在场景之中,很容易乱套,所以还是当做资源文件调用比较合适。 (我目前知道的)Unity 提供了三个读取资源的函数,分别是Resources.Lo...原创 2016-01-19 11:30:01 · 7261 阅读 · 2 评论 -
Unity学习日记-Unity音频处理,自定义滤波函数OnAudioFilterRead
Unity 的现有的资料中,音频处理部分真是少得可怜,每走一步都感觉自己是先驱(虽然应该并不是)。前几天一边学Unity 的基本知识,同时也扫荡了一下Unity 中与音频相关的API。我要做的事情是使用HRTF 对音频进行实时的处理,制造具有方位感的音频,之前提到过HRTF 本质上就是一个滤波器,主要的困难在于,这个滤波器是要进行实时的刷新的,在不同的时间点,这个滤波器是会变化的。原创 2016-01-18 10:30:19 · 7198 阅读 · 2 评论 -
Unity学习日记-Demo再升级,Script创建GameObject物件
上次成功的创建了一个小型的场景,这次目的是使用脚本来进行场景中物件的创建。第一步的目的如下,在一个平面上批量的创建黄色的Cube。创建Cube使用的语句是 GameObject cube = GameObject.CreatePrimitive (PrimitiveType.Cube);然后给cube写入位置信息和颜色信息 cube.transform.po原创 2016-01-17 10:34:37 · 2146 阅读 · 1 评论 -
Unity学习日记-第二个Demo,脚本间的参数传递
控制主要使用GetComponent这个函数。原创 2016-01-15 18:59:00 · 4716 阅读 · 1 评论 -
Unity学习日记-hello world
想把HRTF的音频处理移植到Unity上,因此开始学习Unity,在网上粗略的找了找,音频真是一万年没人翻牌子,只用GUI大概很困难,script大概是免不了了。自己的想法是用js开发,因为入门简单。由于毫无背景,所以没有系统的概念,这里记得大概也会非常的零碎,姑且作为一个备忘录吧。首先在跟着这个blog学习:http://blog.163.com/shininglore@126/bl原创 2016-01-15 17:42:08 · 564 阅读 · 0 评论 -
Unity学习日记-Creating Scripts
在Unity GUI 中creat script时会自动生成一个模板using UnityEngine;using System.Collections;public class MainPlayer : MonoBehaviour { // Use this for initialization void Start () { Debug.Log("Fuck原创 2016-01-15 18:33:50 · 388 阅读 · 0 评论 -
Unity 读取资源文件 Resources.Load()
Unity 中使用 Resources.Load() 命令读取资源文件。使用中有几个值得注意的地方:读取文件时的根目录是 Assets/Resources,所有资源文件都放在该文件夹下,命令中的路径从 Resources 文件夹里开始写。用 / 表示子文件夹。读取的文件不要加文件的后缀。Load 后 <> 中写入读取的类型。举个例子,如果我们想要读取音频文件 Asset...原创 2018-11-04 10:39:57 · 37399 阅读 · 3 评论