- 博客(7)
- 资源 (10)
- 收藏
- 关注
转载 距离和相似度度量
原文地址:http://webdataanalysis.net/reference-and-source/distance-and-similarity/在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。当然衡量个体差异的方法有很
2013-02-18 21:45:22 1039
转载 永不死机的电脑
电脑死机是世界上最令人抓狂的事情,没有之一。近日,国外一组科学家成功研发了号称一台永远都不会死机的电脑,这台电脑不死机的秘诀在于混乱无序。这就是所谓的乱中有序,无招胜有招吗? 这台电脑名为 systemic,由英国伦敦大学学院的科学家们设计和建造,和现在我们使用的电脑完全不同。我们现在使用的电脑循序执行任务,一次执行一个指令,过程繁重,在进行下一步之前还需要将结果存回存储器中。
2013-02-16 16:00:18 880
转载 Kmeans 使用 Matlab code
原文链接:http://blog.163.com/crazyzcs@126/blog/static/129742050201021911542817/K-means聚类算法采用的是将N*P的矩阵X划分为K个类,使得类内对象之间的距离最大,而类之间的距离最小。使用方法:Idx=Kmeans(X,K)[Idx,C]=Kmeans(X,K) [Idx,C,sumD]=Kmea
2013-02-16 15:58:56 1755
转载 使用NLTK计算word的相似度
5 Similarity>>> dog = wn.synset('dog.n.01')>>> cat = wn.synset('cat.n.01')synset1.path_similarity(synset2): Return a score denoting how similar two word
2013-02-16 07:57:12 4243 1
原创 JGibbLDA使用
官方网址:http://jgibblda.sourceforge.net/其实也有一个GibbLDA 不过是linux下的,可能对于习惯了windows下的用户不太习惯JGibbLDA是GIbbLDA的java版本,可以再window下使用了。在官网上下载lda代码根据说明准备数据的格式在eclips中打开这个工程,之后再run configuration中写上必要的参
2013-02-04 20:23:49 5545 5
原创 PHP 对 MongoDB 操作
给一个例子,一目了然:<?php//$text = "hello the world";//echo $text;// connect//$dburl = '172.29.34.183';//$port= '27017'; $m = new Mongo('172.29.34.183:27017');// select a database$db = $m->Imag
2013-02-02 10:07:50 887
原创 Columbia374 使用
Columbia374 是一个图片内容的检测(image concept detection)但是download中作者仅仅给了image的特征,模型,标记等。这里主要介绍下怎么使用这个模型去检测我们自己的图片。首先模型使用的是libsvm产生的model,图片的特征作者没有给代码但是paper里面有介绍但是我不敢保证自己的code是不是跟作者完全一样。所以搜索后发现了Colu
2013-02-02 10:01:49 751
AVCimplementation
2014-05-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人