关于李沐讲解的softmax regression的详解

最新推荐文章于 2024-07-25 18:22:10 发布

新旺专注

最新推荐文章于 2024-07-25 18:22:10 发布

阅读量204

点赞数

文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/HS1617250/article/details/125992631

版权

原版视频链接3.3 最简单也同样最常用的线性模型【斯坦福21秋季：实用机器学习中文版】_哔哩哔哩_bilibili

1.之前即使其他样本xi不是我们最终需要关注的但也因为要使得MSE等于0而去关注，消耗了算力。

2.算完Oi后不去做MSE优化而是先看它的一个能作为最终解的概率（用softmax（））。

3.softmax,将向量化为一个概率向量，理想情况下其最高概率者与置信度最高者重合，同为递增函数，所以也将该模型泛指为线性模型。

4.交叉熵分析预测概率和真实概率的loss。因为yi除了一个1 其他都为0，要想使得loss小则要使得log~最大，使得yi=1乘到最大的y拔上也就是argmaxxi oi上并使其最大，得到的w和b则为所需

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

新旺专注

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于李沐讲解的softmax regression的详解

softmax regression解释
复制链接

扫一扫

第十三章：AI大模型在教育领域的应用

禅与计算机程序设计艺术

01-19

596

教育领域的发展受到了人工智能（AI）技术的推动。AI大模型在教育领域的应用具有巨大的潜力，可以帮助改善教育质量、提高教学效率、提高学生成绩和提高教育资源的利用率。本章将从背景、核心概念、核心算法原理、最佳实践、应用场景、工具和资源推荐以及未来发展趋势等方面进行全面的探讨。AI大模型在教育领域的应用具有巨大的潜力，但也面临着一些挑战，如数据隐私、算法解释性、教育资源不均等等。未来，AI大模型将继续推动教育领域的发展，提高教育质量、提高教学效率、提高学生成绩和提高教育资源的利用率。

多模态大模型：技术原理与实战在LLM时代，对软件研发的更多思考————从软件 1.0 迈向软件 2.0 时代

禅与计算机程序设计艺术

06-29

578

软件1.0 vs 软件2.0 - **软件1.0**：传统的软件开发方法，通过人工编写明确的**程序逻辑和规则**来实现功能。 - **软件2.0**：利用AI和机器学习技术，通过**训练模型来"学习"如何执行任务，而不是显式编程**。在这种范式下，软件的行为更多地**由数据和学习算法决定，而不是固定的规则。**

参与评论您还未登录，请先登录后发表或查看评论

动手学深度学习3.6 softmax回归的从零开始实现-笔记&练习（PyTorch）

scdifsn的博客

05-01

1028

李沐老师《动手学深度学习（PyTorch版）》3.6 softmax回归的从零开始实现-笔记&练习详解

动手学深度学习3.4 softmax回归-笔记&练习（PyTorch）

scdifsn的博客

04-25

1346

李沐老师《动手学深度学习（PyTorch版）》3.4 softmax回归-笔记及练习详解

详解注意力机制和Transformer

zyw2002的博客

01-31

8942

本文的学习路线： 📍 Attention 从生物学的角度引入到计算机视角，介绍了什么是Attention ▶️介绍Encoder-Decoder框架 (目前大部分Attention Model都是依附于该框架实现)▶️ 介绍了Attention模型中的基础概念查询、键和值 ▶️ 通过讲解Nadaraya-Watson核回归模型来了解常见的注意力汇聚模型 ▶️ 介绍了Attention Model中两个常用的注意力评分函数 ▶️ 从基础的Attention引入到Self-Attention 和Multihe

动手学深度学习3.7 softmax回归的简洁实现-笔记&练习（PyTorch）

scdifsn的博客

05-06

1267

李沐老师《动手学深度学习（PyTorch版）》3.7 softmax回归的简洁实现-笔记&练习详解

李沐精读论文：ViT 《An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale》

iwill323的博客

12-20

2115

李沐精读论文：ViT 《An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale》 position embedding patch embedding ViT-B/16 vision transformer MLP Head vision transformer

李沐基于Pytorch的深度学习笔记（7）-线性回归的基本实现（附代码）

m0_57628341的博客

02-28

669

1 线性回归的实现这里我参考了这篇博客 python机器学习手写算法系列——线性回归_juwikuang的专栏-CSDN博客_python 机器学习 由于李沐老师的课程中使用的d2l和我安装的部分库存在冲突，所以我没有使用他的方法进行线性回归。整体的步骤和我们上面讲到的一个模型步骤是一样的。不过这里呢我们用的是上面的步骤来实现李沐老师的方案。 import torch import numpy as np import pandas as pd import random def s

从基础到高级：AI大模型开发的技术栈

禅与计算机程序设计艺术

01-17

1205

人工智能（AI）技术在近年来取得了突飞猛进的发展，其中大模型（Large Language Models，LLMs）的出现更是掀起了新一轮的技术革命。从OpenAI的GPT系列到Google的BERT，再到更近期的Claude和PaLM，这些大模型展现出了惊人的语言理解和生成能力，正在重塑我们与技术交互的方式。然而，开发如此复杂的AI系统并非易事，它需要一整套完善的技术栈支持。本文旨在全面剖析AI大模型开发的技术栈，从基础理论到实际应用，为读者提供一个清晰而深入的认识。

李沐 机器学习.txt

03-05

李沐的视频教程哦。

torchvision.zip

10-23

这个数据集的标签是基于Softmax分类的，Softmax函数是一种在多分类问题中广泛使用的激活函数，它将神经网络的输出转换为概率分布，使得每个类别的概率总和为1。在PyTorch中，处理Fashion-MNIST数据集时，我们通常...

mnist_train_small.csv

11-18

李沐深度学习softmax

李沐深度学习.zip

05-08

在"content"这个文件中，可能包含了李沐关于这些深度学习概念的详细讲解，例如理论解释、代码示例、实践项目或者课程笔记。通过深入学习这些内容，读者可以全面理解深度学习的基本原理，掌握模型构建和训练技巧，为...

2022213854 李沐窈.zip

06-16

很抱歉，根据您提供的信息，"2022213854 李沐窈.zip"似乎是一个个人文件，且没有提供任何特定的标签或压缩包子文件的详细文件名，这使得我无法直接生成相关的IT知识点。通常，一个压缩包文件（如.zip）可能包含各种...

从零开始学习机器学习，掌握AI未来的关键！

qq_42538588的博客

07-25

1725

欢迎来到"人工智能-机器学习基础"！在本文中，我们将一起探索人工智能的奇妙世界。首先，让我们来介绍一下人工智能的概述。人工智能（Artificial Intelligence）是一门研究如何使机器具备智能能力的科学与技术。简单来说，它是能够像人类一样思考、学习和决策的机器。人工智能可以追溯到上个世纪50年代，当时科学家们就开始尝试模仿和理解人类的思维过程。然而，由于当时计算机技术的限制，人工智能的发展并不顺利。直到最近几年，随着计算能力的迅猛增长和大数据的普及，人工智能取得了巨大突破。

学习C语言第12天（数组练习）

2301_79600945的博客

07-24

637

把任意数字从中间拆分拆分后的乘积之和等于自身，则是一个水仙花。例如：655=6*55+65*5。

C语言100道基础拔高题（1）

2303_78660417的博客

07-23

3372

最后按最小值，中间值，最大值的顺序打印即可。解题思路：首先输出由这几个数字所组成的所有三位数，接着再设置条件，使其输出的三位数不重复，下面我们来看下源代码。值得注意的是：所以题目的代码都是作者自行编写，如有更好的思路或者代码的优化，还请指出更正。解题思路：首先找到能整除这个正整数的最小正数，接着重置循环初值，让它继续查找最小正数，最后将得到的所有正数放到一个数组里，最后设置好格式之后循环打印出来。解题思路：首先确定好区间，接着判断是否是素数，素数就是一个大于1的数，除了1和它本身之外，不能被其他数整除。

【算法】退火算法 Simulated Annealing