机器学习中关于参数学习方法、非参数学习方法的理解

一只菜得不行的鸟

已于 2023-01-05 23:14:53 修改

阅读量1.2k

点赞数 1

分类专栏：机器学习文章标签： 1024程序员节

于 2022-10-24 00:14:48 首次发布

原文链接：https://www.jianshu.com/p/d22eecb43b04

版权

机器学习专栏收录该内容

11 篇文章 2 订阅

订阅专栏

在机器学习中，有非参数算法与参数算法，那么它们之间有什么差别呢？

参数机器学习算法
A learning model that summarizes data with a set of parameters of

fixed size (independent of the number of training examples) is called a

parametric model. No matter how much data you throw at a parametric

model, it won’t change its mind about how many

parameters it needs.

假设可以最大程度地简化学习过程，与此同时也限制可以学习到是什么。这种算法简化成一个已知的函数形式，这称为参数机器学习算法。

这种算法包括两种步骤：

1. 选择一种目标函数的形式；

2. 从训练数据中学习目标函数的系数。

一种最容易理解目标（映射）函数的形式就是一条直线，用于线性回归：

此处的、和是直线的系数，用于控制直线的截距和斜率，和是两个输入变量。

参数机器学习算法的一些常见例子包括：

Logistic Regression

LDA（线性判别分析）

感知机

朴素贝叶斯

简单的神经网络

参数机器学习算法的优点：

简单：这些算法很容易理解和解释结果；

快速：参数模型可以很快从数据中学习；

少量的数据：它们不需要太多的训练数据，甚至可以很好地拟合有缺陷的数。

参数机器学习算法的局限性：

约束：这些算法选择一种函数形式高度低限制模型本身；

有限的复杂性：这种算法可能更适合简单的问题；

不适合：在实践中，这些方法不太可能匹配潜在的目标（映射）函数。

非参数机器学习算法
Nonparametric methods are good when you have a lot of data and no

prior knowledge, and when you don’t want to worry too much about

choosing just the right features.

不对目标函数的形式作出强烈假设的算法称为非参数机器学习算法。通过不做假设，它们可以从训练数据中自由地学习任何函数形式。

在构造目标函数时，非参的方法寻找最合适的训练数据，同时保留一些对不可见数据的泛化能力。因此，这些非参方法能够拟合大多数的函数形式。

一种理解非参模型的最好例子是KNN算法，对于一个新的数据实例，KNN基于K个最相似的训练模式（已标记的实例）。这种方法除了模式可能更接近有一个相似的输出变量之外，不需要对目标函数的形式作出任何的假设。

非参数机器学习算法的一些常见例子包括：

KNN

决策树，比如CART和C4.5

SVM

非参数机器学习算法的优点：

灵活性：拟合大量的不同函数形式；

能力：关于潜在的函数不需要假设（或者若假设）；

性能：可以得到用于预测的高性能模型。

非参数机器学习算法的局限性：

更多的数据：需要更多的训练数据用于估计目标函数；

慢：训练很慢，因为它们常常需要训练更多的参数；

过拟合：更多的过度拟合训练数据风险，同时它更难解释为什么要做出的具体预测。

https://www.jianshu.com/p/d22eecb43b04
https://www.jianshu.com/p/e4c18f6538d2

总结就是所谓参数学习算法它有固定的明确的参数，参数一旦确定，就不会改变了，我们不需要在保留训练集中的训练样本。而非参数学习算法，每进行一次预测，就需要重新学习一组，是变化的，所以需要一直保留训练样本。

一只菜得不行的鸟

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习中关于参数学习方法、非参数学习方法的理解

一种理解非参模型的最好例子是KNN算法，对于一个新的数据实例，KNN基于K个最相似的训练模式（已标记的实例）。这种方法除了模式可能更接近有一个相似的输出变量之外，不需要对目标函数的形式作出任何的假设。在构造目标函数时，非参的方法寻找最合适的训练数据，同时保留一些对不可见数据的泛化能力。不对目标函数的形式作出强烈假设的算法称为非参数机器学习算法。此处的、和是直线的系数，用于控制直线的截距和斜率，和是两个输入变量。少量的数据：它们不需要太多的训练数据，甚至可以很好地拟合有缺陷的数。
复制链接

扫一扫

专栏目录

一只菜得不行的鸟 CSDN认证博客专家 CSDN认证企业博客

码龄7年

69: 原创

3360: 周排名

1万+: 总排名

29万+: 访问

: 等级

1792: 积分

2万+: 粉丝

690: 获赞

99: 评论

805: 收藏

私信

关注

热门文章

分类专栏

计网 7篇
c 16篇
机器学习 11篇
python 35篇
通信 1篇
Linux 2篇
java 1篇
操作系统 1篇
笔记 22篇
计组 1篇
数据库 1篇
英语 1篇

最新评论

对于此版本,windows installer和即点即用的Office不能并行运行，因此只能安装一种类型（安装Visio破解版时的报错）
2401_86554481: 课时我刚买的2021
如何将b站缓存的m4s视频转换成mp4格式
一只菜得不行的鸟: 大家看参考的文章即可。最近太忙了，没时间更新博客
Windows下socket网络编程，C++，Email的客户端程序(支持邮件基于SMTP的发送和POP3的接收)
一只菜得不行的鸟: 课程报告https://download.csdn.net/download/qq_40967086/89517304?spm=1001.2014.3001.5503
java中的\t说明
MYGAG: 我用chatgpt进行了询问，总结就是空格、数字和字符的长度一般是固定的，而制表符是为了保证对齐的，所以是根据内容而确定长度的，还有在java中，空格、数字、字符、制表位的length都是1
java中的\t说明
MYGAG: 在Java中，\t（水平制表符）用于在文本中插入一个制表位，其目的主要是为了对齐文本。制表符的显示长度不是固定的，而是依赖于它在文本中的位置以及输出设备或显示环境（如终端或文本编辑器）的设置。制表符通常将文本移动到下一个制表位，这些制表位在许多环境中默认是每隔8个字符位置设置一个。如果制表符后面紧跟着的文本已经接近或超过了下一个制表位，\t 将会跳到再下一个制表位。这就是为什么在不同的文本前使用 \t 时，看起来空出的空间长度不一样的原因。例如，如果你有一个字符串 "heima\t"，并且 "heima" 的长度是5，那么 \t 只需要添加额外的3个空格长度就能达到下一个制表位（假设制表位每8个字符一个）。但如果字符串是 "heima001\t"，长度是8，那么 \t 将会添加足够的空格以达到下一个制表位，这可能是8个空格，使得总长度达到16。这种行为使得 \t 在不同的上下文中看起来“长度”不同，但实际上它只是在尝试将文本对齐到下一个制表位。这也是为什么在编程和数据输出中，使用制表符来对齐数据是很常见的做法，尤其是在需要列对齐的情况下。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。