- 博客(3)
- 收藏
- 关注
转载 线性回归标准方程及其概率解释
线性回归作为一种监督学习方法,在机器学习领域中属于最基本的优化问题,即根据现有的数据集,找到一个能够最好拟合这组数据的线性函数即可,根据这个线性函数对新来的数据进行预测。本文将会覆盖最简单的线性回归的解释和标准方程求解最优线性回归参数,至于梯度下降法求解,会有单独的另外一篇博客介绍。什么是回归分析显而易见,线性回归就是一种回归分析,那么什么是回归分析呢?简单的说
2014-07-17 20:02:05 11410 1
转载 K-Means聚类的Python实践
K-Means应该是最简单的聚类算法之一了吧,理论上很简单,就是随即初始化几个中心点,不断的把他们周围的对象聚集起来,然后根据这群对象的重置中心点,不断的迭代,最终找到最合适的几个中心点,就算完成了。然后,真正实践的时候才会思考的更加深入一点,比如本文的实践内容就是一个失败的案例(算法是成功的,场景是失败的)。什么是聚类简单的说,就是对于一组不知道分类标签的数据,可以通
2014-07-17 17:56:07 2800
转载 蓄水池抽样算法证明
这个题很老了,刚刚遇到一个类似的题目,不是让写怎么实现的,而是要证明结果确实是等概率,我了擦一下子忘了怎么证明了,以前竟然是把答案给背下来了,鄙视一下自己原题:现在有一组数,不知道这组数的总量有多少,请描述一种算法能够在这组数据中随机抽取k个数,使得每个数被取出来的概率相等。即假如一共有N个数,那么最终结果是每个取出来的数都是以1/N的概率取出来的。答案据说这是
2014-07-17 17:55:04 1618
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人