线性数据与非线性数据的区别

最新推荐文章于 2023-07-13 07:47:38 发布

流动的风与雪

最新推荐文章于 2023-07-13 07:47:38 发布

阅读量7.8k

点赞数 9

分类专栏：机器学习文章标签：非线性数据线性数据线性可分

原文链接：https://blog.csdn.net/HiWangWenBing/article/details/123555129?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522166796052216782425652880%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=166796052216782425652880&biz

版权

机器学习专栏收录该内容

20 篇文章

订阅专栏

变量的线性与非线性

最常使用的线性是指“变量之间的线性关系”，它表示两个变量之间的关系可以展示为一条直线，即可以使用方程y=kx +b来进行拟合。

要探索两个变量之间的关系是否是线性的，最简单的方式就是绘制散点图，如果散点图能够相对均匀地分布在一条直线的两端，则说明这两个变量之间的关系是线性的。
在这里插入图片描述

数据的线性与非线性

数据的线性与非线性，与应用场景密切相关。对于拟合回归与分类，数据的线性与非线性的定义完全不同。

一组数据由多个特征和标签组成，特征为自变量，标签为因变量：

当这些特征分别与标签存在线性关系的时候，我们就说这一组数据是“线性数据”。
当特征矩阵中任意一个特征与标签之间的关系需要使用三角函数，指数函数等函数来定义，则我们就说这种数据叫做“非线性数据”。

在这里插入图片描述
在上述图形中，特征值X是X轴上连续的数值点，标签值Y是Y轴上连续的数值点。

数据的线性可分与非线性可分

在这里插入图片描述
在上述图形中，特征值(X1, X2) 是平面上的连续点，标签值Y是点的颜色，是离散的。

在分类中，我们绘制的是数据分布图，横坐标是其中一个特征，纵坐标是另一个特征，标签则是数据点的颜色（类别）。因此在分类数据中，我们使用“是否线性可分”（linearly separable）这个概念来划分分类数据集。当分类数据的分布上可以使用一条直线来将两类数据分开时，我们就说数据是线性可分的。反之，数据不是线性可分的。

总之：对于分类问题，数据分布若能使用一条直线来划分或分割或隔离类别，则是线性可分的，否则数据则是线性不可分的。

模型拟合数据的思路

1、用线性模型去拟合线性分布的数据。

2、用非线性模型去拟合非线性分布的数据。也可以用非线性模型去拟合线性分布的数据。

3、可以通过通过一些特殊的数据预处理，把非线性数据转换线性分布，然后再用线性模型去拟合。

参考文献：
[机器学习与scikit-learn-31]：算法-回归-线性模拟拟合拟合非线性数据-概述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。