机器学习笔记（一）

最新推荐文章于 2024-10-01 23:00:34 发布

曾英俊

最新推荐文章于 2024-10-01 23:00:34 发布

阅读量355

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanhu6955/article/details/118993552

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

机器学习是让计算机在无明确编程的情况下学习，包括监督学习（如回归、分类问题）和无监督学习（如聚类分析）。监督学习通过调整函数参数降低成本函数，如梯度下降法。无监督学习则探索数据内在结构。模型优化涉及选择合适的成本函数并使用梯度下降法更新参数，以提高预测准确性和性能。

摘要由CSDN通过智能技术生成

什么是机器学习？

机器学习是一个研究领域，它使得计算机在没有明确编程的情况下学习。Tom Mitchell给出了更加现代化的定义：如果计算机程序在任务 T 中的性能（以 P 衡量）随着经验 E 提高，则称该计算机程序从经验 E 中学习某些类别的任务 T 和性能度量 P。

eg：下棋

T = 进行一盘棋的对弈

P = 从对局中获胜

E = 多次对局的经验

一般而言，机器学习可分为两类，即监督学习与无监督学习。

监督学习

在监督学习中，我们获得一组数据集包含输入输出，并且可以正确评定输出的正确性。

监督学习可以根据输出结果划分成“回归”和“分类”问题。

在回归问题中，输出结果通常是连续的，并且通过将输入输出之间联系找到函数进行映射。在分类问题中，输出结果通常是离散的，需尝试通过输入变量映射到离散分类中。

eg：

预测天气湿度变化应考虑回归问题，预测是否为雨天应考虑分类问题。

无监督学习

在无监督学习中，我们需要在无法预测结果中解决问题，不是基于预测结果的反馈。通常情况下，我们可以从数据推导出结构，但无法明确变量的影响。我们可以基于数据中变量之间的关系进行聚类分析，从而推导出结构。

eg：

聚类：收集一组或多组消费者的消费记录，并根据消费者的消费水平各个指标进行分组，可以预测购物偏好及购买能力。

非聚类：“鸡尾酒会算法”，可让您在混乱的环境中找到结构。（即从鸡尾酒会上的声音网中识别个人声音和音乐）。

模型和成本函数

为了稍微更正式地描述监督学习问题，我们的目标是，给定一个训练集，学习一个函数 h：X → Y，h(x) 是计算机通过学习和训练后得出比较好的预测函数，其中X = Y = ℝ。

成本函数可以用来衡量预测函数的准确性，这往往是通过真实数据进行对应，得出结果的平均差异。

$J(\theta ) = \frac{1}{2m}\sum_{i = 1}^{m}(h(x^{i}) - y^{i})^{2}$ ，平均值减半是为了进行梯度下降时求导。

成本函数是为了可以得到更好的预测函数，因此需要成本函数来引导新的预测函数。成本函数最小化为第一目标。

参数学习

梯度下降通过预估预测函数中的参数进行调整，从而减低对成本函数进行绘制预测参数的成本。以二元线性回归问题为例，成本函数绘制如下：

梯度下降的过程如同图中星星沿着下坡路进行移动。

当我们的成本函数位于图中坑的最底部时，即当它的值是最小值时，我们就会知道我们已经成功了。红色箭头显示图中的最小点。

我们这样做的方法是取我们的成本函数的导数（函数的切线）。切线的斜率是该点的导数，它将为我们提供前进的方向。我们在下降最陡的方向上降低成本函数。每一步的大小由参数α决定，称为学习率。

梯度下降公式：

$\theta _{j} := \theta _{j} - \alpha \frac{\partial J(\theta )}{\partial \theta _{j}}$

我们应该调整我们的参数 α 保证梯度下降算法在合理的时间内收敛。未能收敛或获得最小值的时间过长意味着我们的步长是错误的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

曾英俊 CSDN认证博客专家 CSDN认证企业博客

码龄9年

93: 原创

10万+: 周排名

76万+: 总排名

3万+: 访问

: 等级

1035: 积分

21: 粉丝

20: 获赞

13: 评论

44: 收藏

私信

关注

分类专栏

最新评论

Interventional Few-Shot Learning
MORE_77: hello,博主有试过跑过这个论文的代码吗？，我试着跑readme里面的命令（数据集为miniimagnet那个），跑出来acc=30%左右，论文里MAML基线acc=70%+呀？博主知道咋回事嘛？
BNU53079--雷电爆裂之力（思维）
righting1: if(a1 > 0 && a1 < n) else if (a1==0)为什么要这样，不是应该要判断这个点的坐标是不是端点处的吗
Unsupervised person re‑identification via K‑reciprocal encoding and style transfer
jayvee_: 大佬怎么看
《因果推断入门》总结
西瓜味的屁: 大佬，能不能解释一下C构件和最大C构件
《因果推断入门》总结
大家一起学编程（python）: 学到了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。