李宏毅视频学习笔记1

最新推荐文章于 2024-07-26 00:46:32 发布

t1anye

最新推荐文章于 2024-07-26 00:46:32 发布

阅读量33

点赞数

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/t1anye/article/details/131864364

版权

1. 机器学习的本质就是找到一个人类写不出来的复杂函数

2. 深度学习使用的是类神经网络，输入可以是向量、序列、矩阵，输出可以是数值（regression）、类别（classification）、文本图片

3. regression 和 classification 只是很小一部分，还有structured learning

4. 机器怎么找一个函数？

a. 先猜测一下函数的基本形式

b. 定义Loss函数

c.梯度下降法

局部最大值问题实际上是一个伪问题，并不会真的影响我们去找全局最大值

5. 用一系列分段函数去模拟折线，进一步模拟曲线

对于分段函数，我们可以采用sigmoid函数来近似

故而，对于原始的线性模型，我们可以对其进行更新：

括号例得内容我们可以用矩阵表示：

同理，将整个函数写出矩阵形式：

其中，参数x是我们输入的feature，剩下的都是未知参数：

此时，未知参数的表示和更新如下：

在实际学习过程中，我们将整个样本分成了一个个batch，先取第一个batch开始，计算出batch1的Loss，记为L1，计算出此时L1的梯度。初始的θ0是随机选取的，我们使用L1计算出的梯度g对其进行更新。以此类推，我们可以对剩余的batch挨个进行这样的操作，依次对θ进行更新。当用所有batch更新一次θ时，称为过了一次epoch。除了sigmiod函数，我们也可以用两个Relu去替代一个sigmoid：

再进一步，我们可以重复以上过程，增加神经网络的层数：

随着网络层数的加深，在训练集上的表现更好，但在测试集上的表现会变差，原因在于过拟合（overfitting）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅视频学习笔记1

在实际学习过程中，我们将整个样本分成了一个个batch，先取第一个batch开始，计算出batch1的Loss，记为L1，计算出此时L1的梯度。以此类推，我们可以对剩余的batch挨个进行这样的操作，依次对θ进行更新。2. 深度学习使用的是类神经网络，输入可以是向量、序列、矩阵，输出可以是数值（regression）、类别（classification）、文本图片。随着网络层数的加深，在训练集上的表现更好，但在测试集上的表现会变差，原因在于过拟合（overfitting）a. 先猜测一下函数的基本形式。
复制链接

扫一扫

t1anye CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

184万+: 周排名

29万+: 总排名

819: 访问

: 等级

46: 积分

0: 粉丝

2: 获赞

1: 评论

1: 收藏

私信

关注

热门文章

最新评论

CUDA SETUP: Something unexpected happened.问题解决
CSDN-Ada助手: 恭喜您写了第三篇博客！标题很吸引人，看来您对CUDA SETUP的问题有了深入的了解。解决问题总是意外的，但您能够找到解决方法真是令人钦佩。希望您能继续保持创作的热情，为我们分享更多有关CUDA SETUP的经验和故事。在下一步的创作中，或许可以考虑分享一些实际应用中的案例，或者介绍一些高级技巧。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
问题解决：GPU满了但是没有进程
CSDN-Ada助手: "恭喜你写了第四篇博客！看到你解决了GPU满了但是没有进程的问题，真是太棒了！希望你能继续保持创作的热情，分享更多的经验和技巧。下一步，可以考虑写一些实际案例分析，或者深入研究一些新的技术领域，让读者能够更深入地了解相关主题。加油！" 如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
记录跑Sentence-Bert中出现的问题和收获
CSDN-Ada助手: 非常感谢你的博客分享！你的努力记录和解决问题对于其他开发者来说是非常有价值的。继续保持创作，你的经验和见解将会对更多人有所帮助。除了你提到的问题和解决方法，还有一些与Sentence-Bert相关的扩展知识和技能可以进一步探索。例如，你可以深入了解Sentence-Bert的原理和应用场景，了解如何使用预训练的Sentence-Bert模型来进行文本相似度计算和语义搜索。另外，你还可以学习如何微调和优化Sentence-Bert模型，以适应特定领域或任务的需求。此外，你可以了解一些与torch相关的其他库和工具，以扩展你的深度学习技能。例如，你可以学习如何使用torchtext来处理文本数据，或者学习如何使用torchvision来进行图像处理任务。同时，了解如何使用分布式训练和加速技术，如多GPU训练和混合精度训练，可以帮助你更高效地训练和部署模型。再次感谢你的分享，期待看到你更多有关Sentence-Bert和相关技术的博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。