机器学习ML
文章平均质量分 71
AceMa
Stay Hungry , Stay Foolish!
展开
-
机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用
机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用 版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去转载 2013-03-19 22:00:55 · 1221 阅读 · 1 评论 -
谱聚类(spectral clustering)
1. 谱聚类 给你博客园上若干个博客,让你将它们分成K类,你会怎样做?想必有很多方法,本文要介绍的是其中的一种——谱聚类。 聚类的直观解释是根据样本间相似度,将它们分成不同组。谱聚类的思想是将样本看作顶点,样本间的相似度看作带权的边,从而将聚类问题转为图分割问题:找到一种图分割的方法使得连接不同组的边的权重尽可能低(这意味着组间相似度要尽可能低),组内的边的权重尽可转载 2013-03-22 20:58:46 · 1367 阅读 · 0 评论 -
AUC(Area Under roc Curve )计算及其与ROC的关系
让我们从头说起,首先AUC是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对” 好”的分类结果的追求,同一时期的不同的度量反映了人们对什么是”好”这个最根本问题的不同认识,而不同时期流行的度量则反映了人们认识事物的转载 2013-10-14 20:10:39 · 855 阅读 · 0 评论 -
The ML books recommended by Mike Jordan
Mike Jordan at Berkeley sent me his list on what people should learn for ML. The list is definitely on the more rigorous side (ie aimed at more researchers than practitioners), but going through these转载 2014-05-03 18:46:04 · 980 阅读 · 0 评论 -
Topic Model
基于LDA的Topic Model变形 最近几年来,随着LDA的产生和发展,涌现出了一批搞Topic Model的牛人。我主要关注了下面这位大牛和他的学生: David M. BleiLDA的创始者,04年博士毕业。一篇关于Topic Model的博士论文充分体现其精深的数学概率功底;而其自己实现的LDA又可体现其不俗的编程能力。说人无用,有论文为证: J. Chan转载 2012-12-01 20:58:22 · 1363 阅读 · 0 评论 -
WEKA简介与资源汇总
Weka是一个开源的数据挖掘软件,里面集成了许多经典的机器学习算法,在高校和科研机构中受到了广泛的应用。 本篇博客旨在汇集在Weka学习过程中的学习资料、资源。方便以后的学习者学习。原创 2014-07-18 22:43:52 · 1101 阅读 · 1 评论 -
参数估计:最大似然估计、贝叶斯估计与最大后验估计
简介:在概率统计中有两种主要的方法:参数统计和非参数统计(或者说参数估计和非参数估计)。 其中,参数估计是概率统计的一种方法。主要在样本知道情况下,一般知道或假设样本服从某种概率分布,但不知到具体参数(或者知道具体模型,但不知道模型的参数)。 参数估计就是通过多次试验,观察其结果,利用结果推出参数的大概值。原创 2014-07-23 21:22:27 · 3822 阅读 · 0 评论 -
6 Practical Books for Beginning Machine Learning
6 Practical Books for Beginning Machine Learning by Jasonb on January 27, 2014 in Resources There are a lot of good books on machine learning, but most people buy the wrong ones. A question转载 2014-09-11 00:01:58 · 1223 阅读 · 0 评论 -
Clustering By Fast Search And Find Of Density Peaks -- Sci14发表的聚类算法
This post is about a new cluster algorithm published by Alex Rodriguez and Alessandro Laio in the latest Science magazine. The method is short and efficient, I implemented it using about only 100 li转载 2014-09-24 20:32:59 · 2668 阅读 · 1 评论