神经网络与深度学习--学习笔记（一）

hitLOGIC

已于 2023-03-27 11:41:15 修改

阅读量74

点赞数

文章标签：深度学习神经网络学习

于 2023-03-20 14:36:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hitLOGIC/article/details/129665927

版权

文章介绍了机器学习的基础组件，包括数据、模型、目标函数和算法。线性回归和线性分类是讨论的重点，线性回归关注预测连续值，而线性分类用于决定类别。梯度下降和随机梯度下降是优化模型参数的关键方法，感知机模型在二分类问题中的应用也被提及。

摘要由CSDN通过智能技术生成

目录

二、线性分类与感知机

2.1 线性回归

2.2 线性分类

2.3 感知机模型

一、概述

⾸先介绍⼀些核⼼组件。⽆论什么类型的机器学习问题，都会遇到这些组件：

1. 可以⽤来学习的数据（data）；

2. 如何转换数据的模型（model）；

3. ⼀个⽬标函数（objective function），⽤来量化模型的有效性；

4. 调整模型参数以优化⽬标函数的算法（algorithm）。

二、线性分类与感知机

2.1 线性回归

定义：利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法

示例：

线性回归要素：

训练集(training set)或者训练数据 (training data), 是我们流程中的输入数据，一般称为x

输出数据，一般称为y

拟合的函数（或者称为假设或者模型）：一般写做 y = ℎ(x)；如果是直线，则为y = kx + b

训练数据的条目数(#training set)：一条训练数据是由一对输入数据和输出数据组成的，输入数据的维度n (特征的个数， #features)

学习过程

损失函数

在我们开始考虑如何⽤模型拟合（fit）数据之前，我们需要确定⼀个拟合程度的度量。

损失函数（loss function）能够量化⽬标的实际值与预测值之间的差距。通常我们会选择⾮负数作为损失，且数值越⼩表⽰损失越⼩，完美预测时的损失为0。回归问题中最常⽤的损失函数是平⽅误差函数。当样本i的预测值为yˆ (i)，其相应的真实标签为y (i)时，平⽅误差可以定义为以下公式：

2.2 线性分类

定义：线性分类器则透过特征的线性组合来做出分类决定，以达到此种目的。简言之，样本通过直线(或超平面)可分。

线性分类器输入：特征向量

输出：哪一类。

如果是二分类问题，则为0和1，或者是属于某类的概率，即0-1之间的数。

线性分类与线性回归差别：

输出意义不同：属于某类的概率回归具体值

参数意义不同：最佳分类直线最佳拟合直线

维度不同：前面的例子中，一个是一维的回归，一个是二维的分类

随机梯度下降

即使在我们⽆法得到解析解的情况下，我们仍然可以有效地训练模型。在许多任务上，那些难以优化的模型效果要更好。因此，弄清楚如何训练这些难以优化的模型是⾮常重要的。

我们⽤到⼀种名为梯度下降（gradient descent）的⽅法，这种⽅法⼏乎可以优化所有深度学习模型。 它通过不断地在损失函数递减的⽅向上更新参数来降低误差。

梯度下降最简单的⽤法是计算损失函数（数据集中所有样本的损失均值）关于模型参数的导数（在这⾥也可以称为梯度）。但实际中的执⾏可能会⾮常慢：因为在每⼀次更新参数之前，我们必须遍历整个数据集。因此，我们通常会在每次需要计算更新的时候随机抽取⼀⼩批样本，这种变体叫做⼩批量随机梯度下降（minibatch stochastic gradient descent）。

在每次迭代中，我们⾸先随机抽样⼀个⼩批量B，它是由固定数量的训练样本组成的。然后，我们计算⼩批量的平均损失关于模型参数的导数（也可以称为梯度）。最后，我们将梯度乘以⼀个预先确定的正数η，并从当前参数的值中减掉。我们⽤下⾯的数学公式来表⽰这⼀更新过程（∂表⽰偏导数）：

总结⼀下，算法的步骤如下：

（1）初始化模型参数的值，如随机初始化；

（2）从数据集中随机抽取⼩批量样本且在负梯度的⽅向上更新参数，并不断迭代这⼀步骤。

2.3 感知机模型

感知机原理

总结

目标定位：常用的定位方法有边界框定位和特征点定位；同时，定位问题与分类问题的区别无非在神经网络的输出环节多输出了几个数字用于传达更多的信息。

目标检测：常用的方法有滑动窗口算法和YOLO算法。YOLO算法改善了滑动窗口边界框定位不准的问题，同时运算效率高，甚至可用于实时检测。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
神经网络与深度学习--学习笔记（一）

⾸先介绍⼀些核⼼组件。⽆论什么类型的机器学习问题，都会遇到这些组件：1. 可以⽤来学习的数据（data）；2. 如何转换数据的模型（model）；3. ⼀个⽬标函数（objective function），⽤来量化模型的有效性；4. 调整模型参数以优化⽬标函数的算法（algorithm）。
复制链接

扫一扫

hitLOGIC CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

161万+: 周排名

87万+: 总排名

355: 访问

: 等级

51: 积分

2: 粉丝

0: 获赞

4: 评论

0: 收藏

私信

关注

热门文章

最新评论

深度学习--笔记（自动微分）--来自李沐-动手学深度学习
*穹奇*: 这不是李沐老师的课件吗，你怎么照搬过来还标原创
神经网络与深度学习--学习笔记（三）
CSDN-Ada助手: 恭喜你写了第三篇博客！学习笔记系列文章非常有意义，帮助我们更好地理解神经网络和深度学习。下一步，建议你可以考虑分享一些实际应用场景和案例，这样读者可以更加直观地了解深度学习的实际应用。期待你的下一篇文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
神经网络与深度学习--学习笔记（四）
CSDN-Ada助手: 非常感谢用户分享的学习笔记，神经网络与深度学习是非常具有挑战性的学科，您的学习笔记对初学者非常有帮助。希望您能够继续坚持创作，分享更多的学习心得和经验。下一步的创作建议是可以结合实际案例进行分析和探讨，让读者更好地理解神经网络与深度学习的应用。再次感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
神经网络与深度学习--学习笔记（一）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/614165570。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。