自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

风雪夜归子

喜爱机器学习

  • 博客(8)
  • 收藏
  • 关注

原创 从零开始实现朴素贝叶斯分类算法(连续特征情形)

声明:版权所有,转载请联系作者并注明出处: http://blog.csdn.net/u013719780?viewmode=contents知乎专栏: https://www.zhihu.com/people/feng-xue-ye-gui-zi朴素贝叶斯算法是基于贝叶斯定理和特征之间条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基

2017-10-29 21:15:39 7543 2

原创 从零开始实现朴素贝叶斯分类算法(离散特征情形)

声明:版权所有,转载请联系作者并注明出处: http://blog.csdn.net/u013719780?viewmode=contents知乎专栏: https://www.zhihu.com/people/feng-xue-ye-gui-zi朴素贝叶斯算法是基于贝叶斯定理和特征之间条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基

2017-10-29 21:09:34 2448

原创 从零开始实现主成分分析(PCA)算法

声明:版权所有,转载请联系作者并注明出处: http://blog.csdn.net/u013719780?viewmode=contents知乎专栏: https://www.zhihu.com/people/feng-xue-ye-gui-zi前面两篇文章详细讲解了线性判别分析LDA,说到LDA,就不能不提到主成份分析,简称为PCA,是一种非监督学习算法,经常被用来进行数据降维、有损数据压缩

2017-10-26 12:17:37 79614 12

原创 从零开始实现线性判别分析(LDA)算法(多类情形)

前文详细阐述了只有二类的情形,假设如果是多类情形,该怎么处理才能保证投影后的类别能够较好的分离呢?我们之前讨论的是如何将nn(特征个数)维降到一维,现在类别多了,一维也许已经不能做到投影后达到较好的分离效果。假设我们有nlabelsn_{labels}个类别,需要kk维向量(基向量)来做投影。将这kk维向量表示为W=(w1,w2,…,wk),wi(i=1,2,…,k)是列向量,W = (w_1, w

2017-10-22 19:10:25 12603

原创 从零开始实现线性判别分析(LDA)算法(二类情形)

线性判别分析线性判别分析(Linear Discriminant Analysis或者Fisher’s Linear Discriminant)简称LDA,是一种监督学习算法。LDA的原理是,将数据通过线性变换(投影)的方法,映射到维度更低纬度的空间中,使得投影后的点满足同类型标签的样本在映射后的空间比较近,不同类型标签的样本在映射后的空间比较远。一、线性判别分析(二类情形)在讲解算法理论之前,先补

2017-10-20 18:27:04 5234 2

原创 从零开始实现KNN分类算法

K近邻分类算法 (K-Nearest Neighbor)KNN分类算法非常简单,该算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在确定分类决策上只依据最邻近K个样本的类别来决定待分样本所属的类别。KNN是一个懒惰算法,也就是说在平时不好好学习,考试(对测试样本分类)时才临阵发力(临时去找k个近邻),因此在预测的时候速度比较慢。KNN

2017-10-17 18:37:12 4837

原创 从零开始实现逻辑回归模型

逻辑回归上一篇文章介绍了线性回归、岭回归、lasso回归和多项式回归模型。这些模型都是广义线性回归模型的具体形式,广义线性回归是一种灵活的框架,比普通线性回归要求更少的假设。这一章,我们讨论广义线性回归模型的具体形式的另一种形式,逻辑回归(logistic regression)。逻辑回归模型在工业界是工程师用的非常多的模型了,比如在CTR预测等项目中被大量使用,之所以用的非常普遍,是因为逻辑回归拥

2017-10-16 16:49:43 4259

原创 从零开始实现线性回归、岭回归、lasso回归、多项式回归模型

声明:版权所有,转载请联系作者并注明出处  http://blog.csdn.net/u013719780?viewmode=contents此系列文章会同时在我的知乎专栏上更新In [6]:import numpy as npimport pandas as pdfrom sklearn import datasetsim

2017-10-15 15:22:49 5761

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除