机器学习day1

最新推荐文章于 2024-07-10 11:21:17 发布

因特朗姆

最新推荐文章于 2024-07-10 11:21:17 发布

阅读量60

点赞数

文章标签：机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43247014/article/details/130599794

版权

1、监督学习：算法处理有标记的数据，无监督学习：处理的数据都是未经过标记的，在线学习、批量学习。

2、过拟合：过度概括，欠拟合：模型过于简单。

机器学习的主要挑战是数据的缺乏，数据质量差，代表性不足，信息量不足，模型过拟合、欠拟合。

超参数调整和模型选择

训练两个模型，对比他们对不同测试集的数据泛化能力。但是为了避免过拟合，必须调整不同的超参数，正则化超参数的值。但是你在同一个测试集上一直调整超参数最后得到一个误差很小的模型，这个模型可能对于新数据集的表现可能很差。

保持验证：将训练集分为两部分，一部分用来训练，训练具有各种超参数的多个模型，并且将这些模型在另一部分（验证集）上验证模型效果。

如果你对数据绝对没有任何假设，那么就没有理由更偏好于某个模型，这称为没有免费的午餐（No Free Lunch，NFL）定理。

开始设计系统。首先，你需要回答框架问题：是有监督学习、无监督学习还是强化学习？是分类任务、回归任务还是其他任务？应该使用批量学习还是在线学习技术？如果数据庞大，则可以跨多个服务器拆分批处理学习（使用 MapReduce技术）或使用在线学习技术。

检测指标：RMSE:均方根误差

MAE: 平均绝对误差

rmse其实是2范数，mae是1范数，k范数;

k越大，对大值的变化越敏感，因此rmse对于异常值的敏感性较好。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习day1

但是为了避免过拟合，必须调整不同的超参数，正则化超参数的值。如果你对数据绝对没有任何假设，那么就没有理由更偏好于某个模型，这称为没有免费的午餐（No Free Lunch，NFL）定理。将训练集分为两部分，一部分用来训练，训练具有各种超参数的多个模型，并且将这些模型在另一部分（验证集）上验证模型效果。1、监督学习：算法处理有标记的数据，无监督学习：处理的数据都是未经过标记的，在线学习、批量学习。机器学习的主要挑战是数据的缺乏，数据质量差，代表性不足，信息量不足，模型过拟合、欠拟合。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

因特朗姆 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。