K-Means聚类算法原理

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下...

2017-09-15 16:32:54

阅读数 278

评论数 0

卡方分布

以上讲了一种称为服从正态分布的概率密度函数。今天,讲一讲服从”卡方分布“的概率密度函数。首先给出该函数的定义: ”自由度“是公式中一个重要参数。自由度不同,图形的形状也完全不同! 众所周知,直线方程中的参数k是斜率,它控制着直线的倾斜角度!它不同,图形不同!自由度与斜率相似...

2017-03-30 09:55:04

阅读数 904

评论数 0

说说高斯过程回归

作者介绍:新浪微博ID @妖僧老冯, 9月将赴南京大学(直博生),方向是机器学习与数据挖掘  文章出处:我爱计算机 编者:小便和作者打过几次交道,一直以为是他是已“修成正果”的某某博士,便“毕恭毕敬”地去邀请他写篇牛文。细聊之后才得知小伙子原来是90后,9月份才博士入学。这篇文章对GP进行了...

2016-03-21 21:40:22

阅读数 1776

评论数 0

协方差的意义和计算公式

本文转自http://blog.csdn.net/goodshot/article/details/8611178,所有权利归原作者所有。 本文写的还是蛮清楚的,能让人比较清楚的明白什么是协方差,但是文章评论有人指出文章中存在错误,例如“相互独立一定不相关,不相关不一定独立”,具体看原文评论...

2016-03-17 22:09:26

阅读数 1709

评论数 0

决策树之CART算法

本文转自http://blog.csdn.net/acdreamers/article/details/44664481,所有权力归原作者所有。 在之前介绍过决策树的ID3算法实现,今天主要来介绍决策树的另一种实现,即CART算法。   Contents      1...

2016-03-16 19:43:17

阅读数 709

评论数 0

关于数据挖掘的something

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线...

2015-10-08 16:19:07

阅读数 1926

评论数 0

ARGMAX(以及ARGMIN)的意思

经常在FOLIE里看到argmax和argmin 无奈国内没学过 今天上课又讲到 不学会实在不行啊。。。 于是WIKI了下 http://de.wikipedia.org/wiki/Argmin argmax: argumentum maximi 论证最大? 个人理解就是 以a...

2015-10-01 11:09:08

阅读数 1532

评论数 0

为什么同现矩阵*评分矩阵=推荐结果?

本文转自http://f.dataguru.cn/thread-229459-1-1.html,所有权力归原作者所有。对文章中一些描述比较含糊的地方作了修改。 举一个  用户3  对  物品102   是否感兴趣的例子: 用户3对所有物品的评分, 评分不为0说明用户3喜欢这东西 ...

2015-07-25 17:19:56

阅读数 1313

评论数 0

Fisher线性判别(*)

本文转自http://blog.csdn.net/carson2005/article/details/6699939,仅供学习之用,另外

2014-11-03 16:00:04

阅读数 1195

评论数 0

一、Linear Regression

先定义好我们所使用的符号语言,大写的表示我们input的自变量,其中表示自变量有p个维度,也可以说其有p个feature或者p个属性,每个维度可以是离散的或者连续的值。大写的表示我们需要output的因变量,其中表示因变量有m个维度,每个维度可以是离散值或者连续值,通常情况下m=1,下面如果没有特...

2014-08-13 09:37:02

阅读数 915

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭