大数据
文章平均质量分 78
随风媛55555
这个作者很懒,什么都没留下…
展开
-
Dynamic Time Warping 动态时间规整算法
随笔- 133 文章- 0 评论- 306 Dynamic Time Warping 动态时间规整算法Dynamic Time Warping(DTW)是一种衡量两个时间序列之间的相似度的方法,主要应用在语音识别领域来识别两段语音是否表示同一个单词。1. DTW方法原理在时间序列中,需要比较相似性的两段时间序列的长度可能并不相等,转载 2015-09-28 17:25:50 · 1686 阅读 · 0 评论 -
相对熵(KL距离)的java实现
相对熵(relative entropy或 Kullback-Leibler divergence,KL距离)的java实现(二) 实验中,我们采用两种方法计算概率。一:以字符为单位计算概率;二:以汉语词为单位计算概率在第二种情况下,我们采用Jeasy分词组件进行分词处理,该分词组件为基于前向最大匹配的分词方法,分词结果在绝大多数情况下是正确的。 /**转载 2015-10-26 10:53:03 · 1272 阅读 · 0 评论 -
机器学习中距离和相似性度量方法
漫谈:机器学习中距离和相似性度量方法 Bella 2015-03-10 11:06:46 大数据动向 评论(0)在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义转载 2015-10-26 10:45:15 · 541 阅读 · 0 评论