博客专栏  >  综合   >  机器学习算法

机器学习算法

关注算法思想及其背后的数学原理。

关注
5 已关注
13篇博文
  • 降维——PCA(主成分分析)

    降维技术使得我们可以用低维向量表示高维向量。PCA是降维技术的一种,它的思想是,把一个高维向量投影到低维子空间中,子空间基的选择原则是尽量使得投影前不同的向量在投影后依旧不同。接下来,我们就具体介绍P...

    2016-09-15 00:25
    1208
  • 线性回归——最小二乘求解

    线性回归 线性回归用于数值预测,它的主要思想是利用预定的权值将属性进行线性组合来表示类别: y=w0+w1x1+w2x2+...+wnxny = w_0 + w_1x_1 + w_2x_2 + ....

    2016-09-11 14:47
    742
  • 划分聚类——Kmeans算法

    划分聚类 聚类是针对一堆没有类别属性的对象的,它把这一大堆对象分成一些小堆,并保证小堆内的对象之间彼此相似,小堆之间的对象彼此不同。划分聚类是聚类的一种,由它生成的小堆,小堆间没有一样的元素,大堆小...

    2016-09-04 21:07
    723
  • 层次聚类——自底向上方法

    直观认识 假设数据集D={a,b,c,d,e}D=\{a, b, c, d, e\}, 在D上运行自底向上的层次聚类算法的过程如下图所示:

    2016-09-04 22:51
    1141
  • 序列模式挖掘——GSP算法

    序列模式挖掘的基本概念 项目全集I、项集X和事务集合T的概念和文章关联规则挖掘——Apriori算法 中定义的一致。一个序列(Sequence)是一个有序的项集列表,这个有序通常是指时间有序。

    2016-09-01 20:29
    1266
  • 关联规则挖掘——Apriori算法

    前言 大二的时候,一个老师为了勾起我们对数据挖掘的兴趣,老是问我们这个问题:你们知道超市为什么要把啤酒跟尿布放在一起吗?但是从来没告诉我们答案。现在,很多人都听过这个问题,觉得很平常,但是那时的我真...

    2016-08-31 00:26
    844
  • KNN(K-最近邻)

    算法介绍 KNN分类算法应该是最容易理解的机器学习算法了。它是惰性学习法的一种,它并不从训练数据集中得到一个分类模型,而是简单的存储这些训练数据,当一个待分类数据X到来时,它计算X和训练数据集中所有...

    2016-08-29 00:07
    491
  • 决策树

    基础 熵 如果X是一个离散型随机变量,取值空间为R,其概率分布为p(x)=P(X=x),x∈Rp(x) = P(X = x), x \in R。那么,X的熵定义为: H(X)=−∑x∈Rp(x)...

    2016-08-27 00:00
    579
  • 基于图的评级算法——HITS

    基本思想 HITS是Hypertext Induced Topic Search的缩写,它不仅给图中节点打上权威性(也就是PageRank算法中的重要性)分值,也打上中心性分值。中心性分值由该节点指...

    2016-08-20 16:37
    400
  • 基于图的评级算法——PageRank

    简介 PageRank算法由Google创始人提出,用来给互联上的网页进行重要性打分。

    2016-08-20 13:55
    818
  • 基于图的评级算法基础——马尔可夫链

    本文只介绍离散时间的马尔可夫链,但这对于理解接下来要讲的PageRank算法、HITS算法和TextRank算法足够了。

    2016-08-18 23:22
    591
  • 朴素贝叶斯文本分类

    基础知识 1.多项式定理 (x1+x2+...+xr)n=∑(n1,...,nr):n1+...+nr=n(nn1,n2...nr)xn11xn22...xnrr(x_1 + x_2 + ... ...

    2016-08-24 22:29
    553
  • 朴素贝叶斯分类

    基础知识

    2016-08-23 12:31
    394

img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部