![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 77
飞翔的老鹰
折腾,学习,没有止境
展开
-
K近邻学习-距离计算补充-带你分析鸢尾花数据
一.K近邻(k-NN)理论介绍这是一个简单的学习学习方法,易于理解,属于监督学习,同时也是懒惰学习的著名代表。对于简单的数据分析,不涉及到很多的特征时候,k近邻算法有着突出的表现,比较适合分类任务。它的工作机制很简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个样本的信息进行预测。在分类的任务中使用投票法(即选择这k个样本出现最多的类别标记作为预测结果),在回归任务中使用平均法(把这k个样本的实际值输出标记的平均值作为预测结果)。更近一步深入的话,可以基于距离的远原创 2020-05-31 16:18:49 · 5511 阅读 · 6 评论 -
拉格朗日乘子法及浅谈Svm
拉格朗日乘子法是干啥的简单点来说给你一个z=ƒ(x,y),求这个函数的极值(x0,y0),但是我有个约束条件,这个约束条件是φ(x,y)=0。就是说你找到的极值点必须满足φ(x0,y0)=0.在数学最优问题中,拉格朗日乘数法是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法,我们暂且先只考虑一个约束条件。(来源百度百科)我们把z=ƒ(x,y)投影到xOy平面,ƒ(x,y)=Ci(i=1,2…n)是一系列的等高线。对于φ(x,y)=0本身就是二维的,因为没有变量Z,所以直接画在xOy平面上。原创 2020-05-15 14:23:09 · 3743 阅读 · 1 评论 -
如何理解西瓜书中AUC和Lrank
首先AUC的定义就是ROC曲线的面积。这是西瓜书上给的定义式子很容易看出是微积分的思想。为什么说AOC越大ROC越理想呢?首先思考一下ROC的定义是什么,从定义入手一切都很简单。只不过是概念多了可能会把你给绕糊涂了。ROC曲线是这样画出来的:给定m+个正例和m-个反例,先把分类的阈值设置到最大,也就是所有的例子预测结果都是反例,此时真正例率和假正例率均为0/在坐标原点处(0,0)标记一个点,然后设置阈值依次为每一个样例的预测值,即将每个样例划分为正例。假设前一个坐标点为(x,y),当前若为真正例,则原创 2020-05-09 17:32:12 · 4801 阅读 · 7 评论