动手学深度学习
文章平均质量分 72
良子c
cv工程师
展开
-
模型选择实战
欠拟合是指模型无法继续减少训练误差。过拟合是指训练误差远小于验证误差。由于不能基于训练误差来估计泛化误差,因此简单地最小化训练误差并不一定意味着泛化误差的减小。机器学习模型需要注意防止过拟合,即防止泛化误差过大。验证集可以用于模型选择,但不能过于随意地使用它。我们应该选择一个复杂度适当的模型,避免使用数量不足的训练样本。原创 2024-01-24 23:49:45 · 513 阅读 · 0 评论 -
深度学习模型选择
作为机器学习科学家,我们的目标是发现模式(pattern)。但是,我们如何才能确定模型是真正发现了一种泛化的模式, 而不是简单地记住了数据呢?接下来介绍几种模型选择时候需要注意的点。原创 2024-01-24 23:12:16 · 524 阅读 · 0 评论 -
多层感知机实战
对于相同的分类问题,多层感知机的实现与softmax回归的实现相同,只是**多层感知机的实现里增加了带有激活函数的隐藏层**。原创 2024-01-21 20:12:17 · 513 阅读 · 2 评论 -
多层感知机
我们可以通过在网络中加入一个或多个隐藏层来克服线性模型的限制, 使其能处理更普遍的函数关系类型。要做到这一点,最简单的方法是将许多全连接层堆叠在一起。每一层都输出到上面的层,直到生成最后的输出。我们可以把前L−1层看作表示,把最后一层看作线性预测器。这种架构通常称为多层感知机(multilayer perceptron),通常缩写为MLP原创 2024-01-21 20:11:21 · 394 阅读 · 0 评论 -
softmax回归实战-分类
pytorch训练一个softmax回归模型,实现图片分类原创 2024-01-20 23:01:21 · 1719 阅读 · 0 评论 -
softmax回归
softmax回归,解决分类问题原创 2024-01-20 23:00:23 · 360 阅读 · 0 评论 -
线性回归理论+实战
线性回归的解可以用一个公式简单地表达出来, 这类解叫作解析解(analytical solution)。像线性回归这样的简单问题存在解析解,但并不是所有的问题都存在解析解。解析解可以进行很好的数学分析,但解析解对问题的限制很严格,导致它无法广泛应用在深度学习里。给定“已学习”的线性回归模型wx+b, 现在我们可以通过房屋面积x1和房龄x2来估计一个(未包含在训练数据中的)新房屋价格。通常我们会选择非负数作为损失,且数值越小表示损失越小,完美预测时的损失为0。回归问题中最常用的损失函数是平方误差函数。原创 2024-01-16 22:22:44 · 354 阅读 · 0 评论 -
预备知识02-自动微分
自动微分是计算一个函数在指定值上的导数深度学习框架通过自动计算导数,即自动微分(automatic differentiation)来加快求导。原创 2024-01-16 22:21:59 · 368 阅读 · 0 评论 -
深度学习预备知识-数据存储、数据预处理
深度学习预备知识--数据如何存储?采用张量的形式存储数据如何预处理?对NaN的值是插值法和删除发原创 2024-01-15 22:20:24 · 723 阅读 · 0 评论 -
深度学习环境安装
conda分为三类:conda:是一种通用包管理系统,旨在构建和管理任何语言和任何类型的软件。原创 2024-01-15 22:18:33 · 646 阅读 · 0 评论