机器学习常用算法原理及优缺点

最新推荐文章于 2022-02-24 17:39:50 发布

善良的弹壳

最新推荐文章于 2022-02-24 17:39:50 发布

阅读量982

点赞数 1

分类专栏：机器学习文章标签：机器学习原理

本文链接：https://blog.csdn.net/weixin_37736146/article/details/96779026

版权

KNN

核心思想是：
物以类聚，人以群分
根据两点距离公式，计算距离，选择距离最小的前k个点，并返回分类结果。

假设一个未知样本数据x需要归类，总共有ABC三个类别，那么离x距离最近的有k个邻居，这k个邻居里有k1个邻居属于A类，k2个邻居属于B类，k3个邻居属于C类，如果k1>k2>k3，那么x就属于A类，也就是说x的类别完全由邻居来推断出来

算法步骤为：
1、计算测试对象到训练集中每个对象的距离
2、按照距离的远近排序
3、选取与当前测试对象最近的k的训练对象，作为该测试对象的邻居
4、统计这k个邻居的类别频率
5、k个邻居里频率最高的类别，即为测试对象的类别

KNN算法的优缺点
1、优点
非常简单的分类算法没有之一，人性化，易于理解，易于实现
适合处理多分类问题，比如推荐用户
2、缺点
属于懒惰算法，时间复杂度较高，因为需要计算未知样本到所有已知样本的距离
样本平衡度依赖高，当出现极端情况样本不平衡时，分类绝对会出现偏差
可解释性差，无法给出类似决策树那样的规则
向量的维度越高，欧式距离的区分能力就越弱

逻辑回归

1.1 什么是逻辑回归
逻辑回归（LR）名义上带有“回归”字样，第一眼看去有可能会被以为是预测方法，其实质却是一种常用的分类模型，主要被用于二分类问题，它将特征空间映射成一种可能性，在LR中，y是一个定性变量{0,1}，LR方法主要用于研究某些事发生的概率。
假定有一个二分类问题，输出y∈{0,1}y∈{0,1}，线性回归模型（公式1.1.1）
在这里插入图片描述
SigmoidFunctionSigmoidFunction（公式1.1.2）：

优点：
实现简单，广泛的应用于工业问题上；
速度快，适合二分类问题
简单易于理解，直接看到各个特征的权重
能容易地更新模型吸收新的数据
对逻辑回归而言，多重共线性并不是问题，它可以结合L2正则化来解决该问题；
缺点

最低0.47元/天解锁文章

善良的弹壳

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
机器学习常用算法原理及优缺点

KNN核心思想是：物以类聚，人以群分根据两点距离公式，计算距离，选择距离最小的前k个点，并返回分类结果。假设一个未知样本数据x需要归类，总共有ABC三个类别，那么离x距离最近的有k个邻居，这k个邻居里有k1个邻居属于A类，k2个邻居属于B类，k3个邻居属于C类，如果k1>k2>k3，那么x就属于A类，也就是说x的类别完全由邻居来推断出来算法步骤为：1、计算测试对象到训练集...
复制链接

扫一扫