个人笔记|机器学习实战
机器学习实战笔记
hjxu2016
好记性不如烂笔头|
独乐乐不如众乐乐|
你的纠错与关注就是对我最大的支持
展开
-
机器学习实战笔记(一)K近邻算法
趁着暑假的档期,总结一下机器学习的一些算法,如有表达不清,或者错误的地方,欢迎指导.本篇是基于<机器学习实战>并参考<西瓜书>以及李航的<统计机器学习>这三本书所记的笔记,所有代码均是由python缩写,且有相对详细的中文注释,其中加入了自己的一些想法.k近邻算法(k-nearest neighbor)也可以叫做KNN,是一种基本的分类和回归方法.输入是训练数据的特征向量,当然,KNN是不具备显式...原创 2018-07-10 20:11:58 · 962 阅读 · 0 评论 -
机器学习实战笔记(三)朴素贝叶斯分类
暑假期间,总结一下以前学过的知识,如有错误,还请指导. 本系列皆是基于<机器学习实战>、李航的<统计学习方法>以及<西瓜书>所记的一些笔记 先提一个最简单的例子: 现在用p1(x,y)表示数据点(x,y)属于类别1的概率, 用p2(x,y)表示数据点(x,y)属于类别2(图中用三角形表示的类别)的概率, 那么对于一个新数据点(x,y),可以用下面的规则来判断它的类别: 如果 p1(x,y)...原创 2018-07-23 21:36:03 · 389 阅读 · 0 评论 -
机器学习实战笔记(二)决策树
之前介绍的K-近邻算法可以完成很多分类任务,但是最大的缺点是无法给出数据的内在含义,而决策树很好的解决了这个问题. 决策树的优点:计算不复杂,输出易于理解,但缺点也很明显,可能会过拟合. 先简单提几个西瓜书中的概念,这里转自https://blog.csdn.net/volvet/article/details/55223569 信息增益 信息熵可以用来衡量样本集合纯度. 假定 样本集合D...原创 2018-07-19 09:37:33 · 350 阅读 · 0 评论 -
机器学习实战笔记(四)逻辑斯蒂回归
逻辑回归算是接触到最优化的内容了,logistic回归的一般过程 step1:收集数据 step2:准备数据,这部分意思是将数据转换成我们的代码需要的数据格式,因为logistic需要计算,所以需要数据类型为数值型,结构化的数据最佳 step3:分析数据 step4:训练算法(占用大量时间),找一个最好的分类回归系数,这边待会会讲 step5:验证算法,很快 step5:对我们需要测试...原创 2018-07-24 20:06:54 · 1168 阅读 · 0 评论 -
线性回归相关知识及公式推导
转自https://www.cnblogs.com/GuoJiaSheng/p/3928160.html 在现实生活中普遍存在着变量之间的关系,有确定的和非确定的。确定关系指的是变量之间可以使用函数关系式表示,还有一种是属于非确定的(相关),比如人的身高和体重,一样的身高体重是不一样的。 线性回归: 1: 函数模型(Model): ...转载 2018-08-15 16:11:16 · 18458 阅读 · 0 评论