统计学习
阿塔塔塔
关注机器学习&数据挖掘,推荐算法&排序算法,菜鸟一枚,永远在学习。
展开
-
Elements of Statistical Learning Ch.2 监督学习
2.3 常用的两种预测方法线性回归的优点是:预测值比较稳定。缺点是:对模型结构需要作出大量假设,预测值可能不准确。 K-NN的优点是:对模型结构作出适度假设,预测值一般来说比较准确。缺点是:不稳定。2.3.1 线性模型和最小二乘线性模型在过去的30年一直作为统计领域的支柱。给定输入变量X=(X1,X2,⋅⋅⋅,Xp)X = (X_1,X_2,\cdot \cdot \cdot,X_p)(在机器学习原创 2015-10-20 11:42:42 · 390 阅读 · 0 评论 -
Elements of Statistical Learning Ch.15 Random Forest 学习笔记
在学习这章之前,并未系统的学习过bagging,不过了解的浅层的东西已经够用了。非常建议大家在学习ESL这本书的同时也学习python中的scikit-learn库。由于经验分布是收敛到真实分布的,所以Bagging (Bootstrap and Aggregation) 这个方法具有可行性。Bagging 中的样本是有放回的抽样。它会形成一个天然的并行模型。同时需要了解的是Bagging这个方法适原创 2015-11-13 11:49:02 · 435 阅读 · 0 评论 -
谱聚类(一)
最近因为要报告文献a tutorial of spectral clustering,所以就仔细地学习了下谱聚类。其中很多大牛的博文都给了我很多帮助,真心的感谢每一个愿意分享学习的心得的大牛们。 这篇博文主要是对文献a tutorial of spectral clustering的一个学习记录,也再次帮助自己深化学习思路。 谱聚类是基于图的一种聚类方法。基本思想是将聚类问题变成图论中图原创 2015-12-18 22:17:42 · 463 阅读 · 0 评论 -
谱聚类(二)
先介绍最基础的 unnormalized Laplacian 的 L=D−WL = D -W.首先给出L的两条性质,性质1 L具有如下性质: 对于任意的向量f∈Rnf \in \mathcal{R}^n有, fTLf=12∑i,j=1nwij(fi−fj)2.f^T L f = \frac{1}{2}\sum_{i,j = 1}^n w_{ij}(f_i-f_j)^2. L是对称半正定的. L原创 2015-12-21 22:42:38 · 474 阅读 · 0 评论 -
数据分析面试必备算法[1] - Regression
马上就要面临找工作和面试的问题,我觉得很有必要对学过的东西进行一下梳理。所以强迫自己每周写一个面试可能会被问到的方面。如果有童鞋看,非常欢迎大家和我一起交流讨论,一起来准备面试~ 首先是最基础的回归算法。对于回归需要了解的知识点有: Linear Regression判断线性模型是否适用于线性回归(残差图,画出yy,y^\hat{y}的关系) 解(Normal Equation, 梯原创 2016-05-21 16:51:37 · 407 阅读 · 0 评论