【机器学习】回归问题（一）

最新推荐文章于 2024-05-24 12:00:00 发布

dzkd1768

最新推荐文章于 2024-05-24 12:00:00 发布

阅读量678

点赞数 3

文章标签：机器学习回归分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dzkd1768/article/details/69942099

版权

首先，我们来看一个例子。

你有一个朋友，他有一套750平方英尺的房子，他来问你能卖多少钱。

然后，你就找来了附近房子的最近买卖信息，然后把面积跟房价画了一条曲线出来。（注：例子与图来自Andrew NG的machine learning课程。）

如图，我们知道的只是上面一些点，横坐标是面积，纵坐标是房价。现在你要怎么预测朋友的房子卖多少钱呢？

开始，你觉得这些点像一条直线，于是就画了一条直线去进过尽量多的点，然后在750的地方画了一条竖线上去，得出房价为150K。

然后你又觉得这个拟合不是很好，你想到二次曲线的形状更符合点的分布，然后又有了蓝色的曲线，根据这条曲线，得出房价为200K。

可见准确的拟合数据的变化趋势是多么重要！

上述的问题就是一个回归问题，即根据已有的数据推测出一系列连续值的属性，从而能预测其他值的输出结果。

简单来说，回归就是求解一些数据服从的函数或者分布。

我们来看另外一个例子：

上图是肿瘤大小和是否为良性的关系，恶性肿瘤标记为1，良性标记为0.

我们发现这组数据不像之前的那样好找规律了。

于是，我们搜集了更多的信息，患者的年龄。

如图，横坐标是肿瘤大小，纵坐标是患者年龄，数据点中圆圈代表良性，×代表恶性。

这次，我们换一种做法，在这个数据空间里找一条直线，但不是过这些点，二是将这些点分在直线两侧。

然后有新的患者，我们将他的特征描到这个空间中，看他属于哪一边，这样就可以大致判断肿瘤的性质。

上面这个问题属于分类问题，即通过已知数据推测出离散的输出值。

这一部分我们通过两个例子解释了回归和分类的区别，这两种算法都是属于监督学习的范畴。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

dzkd1768 CSDN认证博客专家 CSDN认证企业博客

码龄10年

10: 原创

31万+: 周排名

70万+: 总排名

12万+: 访问

: 等级

868: 积分

23: 粉丝

31: 获赞

46: 评论

86: 收藏

私信

关注

热门文章

最新评论

【深度学习-CNN】训练样本不平衡对训练结果的影响
halo～*: 数据不平衡会对训练准确率有影响吗
【深度学习-CNN】训练样本不平衡对训练结果的影响
dzkd1768: 测试时模型已经固定，是没有影响的。训练集偏斜是会导致训练模型出现偏向一部分，会影响后续全部的推理结果，所以需要纠正。
【深度学习-CNN】CNN中的参数与计算量
lmw0320: 我有几点不太明白的： 1. 对于模型的前后向传播，其也只是参数的前后向传播计算，为什么会涉及到图片呢？？也就是说，计算图片占用的空间大小时，不应该考虑这个前后向的翻倍计算吧？？ 2. 上述的计算过程，是针对模型训练过程的计算。而对于模型验证，其不存在反向传播的计算，此处的空间占用计算，则不应该设置这个前后向传播吧？？ 3. 这里的GPU显存计算，对CPU理论上也是相同的吧？毕竟对显卡或内存来说，其都是一个浮点数占用4个字节的空间大小?
【深度学习-CNN】训练样本不平衡对训练结果的影响
qq_41983873: 所以测试集的质量也很重要，现在我看到的研究有关于数据集的质量评估：deep mutation这篇论文利用变异测试来评估测试集的质量。
【目标检测】OpenCV中dnn模块的SSD demo运行
阿翔要努力变强: 博主请问您可以分享一下您编译好的opencv3.1和contrib库吗？真的很需要！谢谢谢谢!!!!!

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。