Hark
文章平均质量分 62
BenjaminYoung29
这个作者很懒,什么都没留下…
展开
-
Hark语音识别学习(一)-Hark desinger的使用
一,安装Hark首先是安装hark。http://www.hark.jp/wiki.cgi?page=HARK+Installation+Instructions 根据该网址来安装即可 我们的系统是Ubuntu14.04二,打开Hark Designer安装成功后打开终端,输入hark_designer,如果成功,就会自动打开系统自带的chrome浏览器,然后就可以使用了。三,增加,连接结点增加结翻译 2016-04-07 23:49:39 · 1593 阅读 · 3 评论 -
HARK学习(三)--文件格式
XML这个格式用于表示位置的文件。hark_xml用途:所有HARK XML文件格式的根节点。属性:hark_xml有强制属性版本(mandatory attribute version?)字节点:config,positions,neighbors,channelsconfig用途:XML文件通用的描述属性:没有属性子节点:有以下可选子节点。除了comment外所有的节点都是用于一个原创 2016-04-12 08:23:15 · 624 阅读 · 0 评论 -
Hark语音识别学习(二)--HARK数据类型
HARK的数据类型Data Types有以下两种:节点的属性节点之间的连接。(内部节点的交流)用来设置属性的数据类型类型 意义 数据类型等级 int 整数类型 基础类型 float 单精度浮点类型 基础类型 string 字符串类型 基础类型 boo原创 2016-04-11 10:09:02 · 1029 阅读 · 2 评论 -
HARK学习(五)--AudioStreamFromMic
大概该节点接受一个来自麦克风阵列的多通道声音波形数据。这个模块可以通过一个TCP/IP的套接字连接,接收IEEE浮点格式的多通道音频流怎么用何时用当希望使用来自麦克风阵列的声音波形数据来作为HARK的系统的输入时使用典型链接输入输出与节点的属性输入:无要求 输出:AUDIO: Matrix类型。有下标。多通道的音频波形数据的行是频道,列是样本。列的大小等于参数LENGTH。 NOT_EOF:bo原创 2016-04-18 08:31:24 · 904 阅读 · 0 评论 -
HARK学习(六)--AudioStreamFromWave
大概该节点从波文件(WAVE file)读取波形数据。读进了Matrix的波形数据是有索引的。有频道行和样本列的多通道音频波形文件必要文件RIFF WAVE格式的音频文件。对通道数和采样频率没有限制。需要16或24bit的有符号整形线性PCM格式。 (WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型。WAVE文件格式是一种由微软和IBM联合原创 2016-04-19 08:30:38 · 746 阅读 · 0 评论 -
HARK学习(七)--ConstantLocalization
大概持续输出常量音源位置结果的节点。有4个参数:ANGLES,ELEVATIONS,POWER,MIN_ID。因为这些参数都是Vector,多个位置结果可以被输出。用法何时用该节点是当使用者想要对一个已知的声源定位结果做评价时使用。比如,当我们想要去判断问题是出在声音分离过程,还是声源定位错误。或者我们想在同一个声源定位情况下去评估声音分离的表现时。典型连接如图,两部分是在两个sheet里。其中LO原创 2016-04-20 08:19:15 · 749 阅读 · 0 评论 -
HARK学习(八)--LoadSourceLocation
大概该节点读取存在SaveSourceLocation节点的源位置信息必要文件SaveSourceLocation里的文件何时用当想重用源位置结果或者评估使用同一个声音分离结果上测试的不同的音源分离方法典型连接 - 输入:没有 - 输出:- SOURCES:Vector<ObjectRef>.读取结果跟ConstantLocalization的Source格式一样。ObjectRef是Sourc原创 2016-04-21 07:42:27 · 778 阅读 · 0 评论