机器学习
文章平均质量分 83
君子美玉
君子美玉
展开
-
K-MEANS算法的C++实现
<br />#include <stdio.h>#include <stdlib.h>#include <math.h>#define NA 4 /* 数据维数 */#define K 3 /* 聚类数 */#define Psize 50 /* 种群大小 */#define T 30 /* 最大迭代数 */#define ED 0.0000001 /* 结束条件 */typedef struct { double p[NA]; double distance原创 2010-12-09 11:30:00 · 1628 阅读 · 0 评论 -
K-means 简介
Kmeans算法<br /> k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。编辑本段算法流程<br /> 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类原创 2010-12-09 10:45:00 · 1699 阅读 · 0 评论 -
DTW(Dynamic Time Warping,动态时间归整)的介绍
<br />在日常的生活中我们最经常使用的距离毫无疑问应该是欧式距离,但是对于一些特殊情况,欧氏距离存在着其很明显的缺陷,比如说时间序列,举个比较简单的例子,序列A:1,1,1,10,2,3,序列B:1,1,1,2,10,3,如果用欧氏距离,也就是distance[i][j]=(b[j]-a[i])*(b[j]-a[i])来计算的话,总的距离和应该是128,应该说这个距离是非常大的,而实际上这个序列的图像是十分相似的,这种情况下就有人开始考虑寻找新的时间序列距离的计算方法,然后提出了DTW算法,这种方法在语原创 2011-03-12 17:44:00 · 25458 阅读 · 7 评论 -
通过K-MEDOIDS算法对时间序列进行聚类的实现
<br />最近做数据挖掘相关的工作,题目是时间序列聚类研究,目前对于这方面的研究都还只是在起步阶段,被广泛使用的还是基于K-MEDOIDS的聚类,放弃K-MEANS的主要原因还是时间序列之间序列的计算难度,对于这方面我们也已经有了一定的进展,不过也还是有很多的问题。<br />把基于DTW与K-MEDOIDS的时间序列聚类的算法贴出来,希望对大家有些帮助吧。<br />这份代码是我在以前的代码的基础上直接改的,所以C和C++有些混用。<br />#include <stdio.h>#include <原创 2011-04-09 23:32:00 · 10625 阅读 · 3 评论 -
主成分分析PCA(Principal Component Analysis)介绍
很久之前,有一次做人脸识别的时候用过PCA,大概记得是降维用的,然后前段时间用到LDA的时候顺带看到PCA才发现忘的差不多了,干脆把一些资料整理一下吧。一.K-L变换说PCA的话,必须先介绍一下K-L变换了。K-L变换是Karhunen-Loeve变换的简称,是一种特殊的正交变换。它是建立在统计特性基础上的一种变换,有的文献也称其为霍特林(Hotelling)变换,因为原创 2012-07-10 23:40:56 · 20559 阅读 · 3 评论 -
使用scipy进行聚类
最近做图像的时候,突然有个idea,需要进行聚类,其实算法很简单,但是当时很急,就直接使用了scipy的cluster。使用起来其实很简单,但是中文的文章很少,所以就简单的介绍一下,感兴趣的也可以自己去看一下英文的文档:http://docs.scipy.org/doc/scipy/reference/cluster.html。这是我从stackoverflow看到的一个demo,如果只是原创 2014-07-06 19:14:11 · 8930 阅读 · 3 评论 -
TensorFlow通过dataset读入不同长度数据
1. 背景dataset是tensorflow支持的一种新的数据读取方式,相对直接feed更加优雅,我个人比较喜欢这种方式。关于具体的使用方式,可以参考这篇文章https://towardsdatascience.com/how-to-use-dataset-in-tensorflow-c758ef9e4428。但是在实际用的过程中,我遇到了一些问题,就是在load变长数据的过程中,会出问...原创 2018-08-10 21:49:17 · 4354 阅读 · 3 评论