李宏毅深度学习Task03

最新推荐文章于 2022-02-13 22:33:24 发布

weixin_44145055

最新推荐文章于 2022-02-13 22:33:24 发布

阅读量102

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_44145055/article/details/118837382

版权

1.误差从哪里来？

模型拟合中误差来源：bias，variance

简单的模型一般具有较大的bias，较小的variance；对于复杂的模型刚刚相反，因为模型越复杂，函数集就越有可能包括target function，所以bias越小。

模型拟合中存在的问题：欠拟合（bias偏大，variance偏小）；过拟合（bias偏小，variance偏大）

解决方法：

（1）large bias：增加输入；提高模型复杂度

（2）large variance：采用更多的数据

（3）平衡bias和variance的方法：采用cross validation，即将训练集分为训练集和验证集，从而提高public测试集的代表性

2.梯度下降

常用梯度下降方法

（1）调整learning rate：设置一个变动的learning rate

（2）Adagrad方法：根据loss function的一次微分和二次微分设置learning rate

（3）随机梯度下降：每次梯度下降只使用一个采样点，加快梯度下降的速度

（3）Feature scaling：调整输入的尺度，类似归一化，从而更快的加速梯度下降的速度

梯度下降的不足：有local minima；在平滑点出现微分为0；在plateua的变化很慢

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_44145055

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

李宏毅深度学习task5

weixin_46714700的博客

07-20

451

局部最小值和鞍点如何区分局部最小点和鞍点一般区分鞍点和局部最优的方法是使用神经网络 loss surface 的 Hessian 矩阵，通过计算 Hessian 矩阵的特征值，进行判断：当 Hessian 矩阵的特征值有正有负的时候，神经网络的一阶导数为 0 的点是鞍点；当 Hessian 矩阵的特征值是非负的时候，神经网络的一阶导数为 0 的点是局部极小值点；当 Hessian 矩阵最小特征值小于零，则为严格鞍点（包含了局部最大）另外一种判断是否是鞍点的方法：若某个一阶导数为0的点在至少一个方向上

网络设计技巧（李宏毅深度学习 task 5）

Yzy_fulture的博客

07-21

611

网络设计技巧1. 局部最小值与鞍点1.1 相关定义：1.2 梯队逼近为0的原因情况的判断local minima和saddle point哪个更常见？2. 批次（batch）与动量（momentum）2.1 批次（batch）2.1.1 概述：2.1.2 为什么要用batch2.1.3 神奇之处：1.noisy的gradient 反而可以帮助training2. 小的batch也对testing有帮助2.2 动量（momentum）2.2.1 一般的gradient descent2.2.2 加上mome

参与评论您还未登录，请先登录后发表或查看评论

机器学习_李宏毅_作业三

ZZPHG的博客

06-19

374

# Author:Richard # 分类食物 Bread, Dairy product, Dessert, Egg, Fried food, Meat, Noodles/Pasta, Rice, Seafood, Soup, Vegetable/Fruit import numpy as np import pandas as pd import os import cv2 import torch import torch.nn as nn import torchvision.transforms a

李宏毅机器学习_7-3训练DNN的技巧

qq_15821487的博客

05-09

166

BUYID测试集效果不好不一定就是过拟合，可能训练集本身就差。针对不同的目标，有不同的优化方式，分清是针对训练过程还是测试过程，训练结果还是测试结果 sigmoid激活函数存在的问题衍生出来了线性的激活函数 B relu是特殊的maxout adgradgrad,不同方向不一样，同一方向一致 RMSRMSprop,不同方向也不一致，参数可以自动学习出来原来原来的惯性和现在的梯度相结合的方式，避免陷入局部最优 adaaadam,就是前面的结合。测试测试集上的优化，把控训练过程 .

李宏毅（2020）作业3-hw3_CNN

顾道长生的科研笔记

10-07

1712

文章目录数据集介绍Homework 3 - Convolutional Neural NetworkDatasetModelTrainingTesting 数据集链接：https://pan.baidu.com/s/1OYqpIQ4N57RY2UjTf8OvOg 提取码：csdn 数据集介绍有训练集、验证集、测试集训练集和验证集带标签，测试集不带标签测试集图片命名仅为序号，无实际意义训练集和验证集图片命名规则为“类别_序号” 这是一个11分类问题 Homework 3 - Convolut.

李宏毅2020机器学习作业3——Convolutional Neural Network

科研鬼才的博客

04-05

5769

开始之前声明：本文参考了李宏毅机器学习作业说明（需翻墙），基本上是将代码复现了一遍，说明中用的是google colab（由谷歌提供的免费的云平台），我用的是Jupyter Notebook 本文用到的资料在百度网盘自取点击下载，提取码：zdth。请将所需资料下载解压，确保资料中有6个文件，并保存到自己的目录当中。【博主的环境：Anaconda3+Jupyter Notebook，pyth...

李宏毅 深度学习作业3 CNN

qq_43573054的博客

09-17

1055

#Import 需要的套件 import os import numpy as np import cv2 import torch import torch.nn as nn import torchvision.transforms as transforms import pandas as pd from torch.utils.data import DataLoader, Dataset import time #Read image 利用 OpenCV (cv2) 讀入照片並存放在 numpy

李宏毅深度学习学习笔记 Task0

08-15

在探讨李宏毅深度学习学习笔记Task0的内容之前，我们需要对深度学习的基本概念有所理解，然后才能根据笔记内容提取具体的知识点。深度学习是机器学习领域的一个分支，它通过建立、训练和应用多层的人工神经网络来...

深度学习简介（李宏毅深度学习 task 4）

Yzy_fulture的博客

07-18

1060

深度学习1. 深度学习的三个步骤1.1 神经网络（Neural network）完全连接前馈神经网络本质：通过隐藏层进行特征转换问题1.2 模型评估（Goodness of function）交叉熵总体损失1.3 选择最优函数（Pick best function）梯度下降反向传播1.链式法则2.相关损失及其解释思考隐藏层越多越好？普遍性定理 1. 深度学习的三个步骤 1.1 神经网络（Neural network）神经网络有着多种的模型，而这也对应着神经元不同的连接方式。下面时一些常见的连接方式对应

卷积神经网络（李宏毅深度学习 task 6）

Yzy_fulture的博客

07-23

592

卷积神经网络1. 为什么使用CNN1.1 Small region为什么我们可以把一些参数拿掉（为什么可以用较少的参数来做影像处理）1.2 Same Patterns1.3 Subsampling2. CNN架构1. 图像分析引出的架构2. 每一个layer所做之事1. 卷积（Convolution）1. property 1（着眼于局部）2. property 2（不同区域相同特征的检测） 1. 为什么使用CNN 本质：使用power-knowledge把原来fully connect layer中一些参

李宏毅ML作业笔记3: 食物分类(kaggle预测与报告题目)

越开源越幸运

07-03

4575

任务介绍数据格式要求代码思路读取图片数据增强及 Dataset类定义数据增强 Dataset类分类模型训练训练集训练训练/验证集共同训练测试报告题目 1. 模型描述 2. 深度减半 3. 转为DNN 4. 模型比较结论

李宏毅机器学习作业3——Convolutional Neural Network

迷雾总会解

12-17

2900

本作业来源于李宏毅机器学习作业说明，详情可看???? Homework 3 - Convolutional Neural Network(友情提示，可能需要翻墙) 作业要求作业要求：在收集来的资料中均是食物的照片，共有11类，Bread, Dairy product, Dessert, Egg, Fried food, Meat, Noodles/Pasta, Rice, Seafood, Soup, and Vegetable/Fruit.我们要创建一个CNN，用来实现食物的分类。我们可以借助

李宏毅机器学习hw3

老问题的博客

12-09

3959

Homework 3 - Convolutional Neural Network 1作业概述在food_11文件中有三个文件分别是training、validation、testing，打开training和validation可以看见总共有11种食物（0-10的类别编号），而testing是没有类别编号的。然后用卷积神经网络对食物图片进行分类。 2导入用到的库 torch库这个我弄了半天，直接pip总是timeout，用镜像源下下来又出现OSError: [WinError..

2021李宏毅机器学习（3）：类神经网络训练不起来怎么办

niexinyu0026的博客

02-13

2083

2021李宏毅机器学习（3）：类神经网络训练不起来怎么办1 任务攻略1.1 如果在训练集上的 loss 始终不够小1.2 如果 loss 在训练集上小，在测试集上大1.3 任务攻略的示意图2 局部最小值 (local minima) 与鞍点 (saddle point)3 批次（batch）与动量（momentum）3.1 批次（batch）3.2 动量（momentum） 1 任务攻略 1.1 如果在训练集上的 loss 始终不够小情况一：model bias（模型本身有很大限制）——构造更复杂的模型

李宏毅2020深度学习课程作业

三金samkam的博客

03-31

8420

Homework 1: Linear Regression 李宏毅老师个人网站链接：http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML20.html 课程b站链接：https://www.bilibili.com/video/av94519857 作业说明YouTube链接：https://www.youtube.com/watch?v=QfU...

李宏毅2020年机器学习作业3学习笔记

求算法实习

05-11

2961

李宏毅2020年机器学习作业3学习笔记前言一、问题描述二、实现过程2.1 调包2.2 数据处理2.3 网络搭建2.4 模型训练2.5数据预测三、完整代码3.1官方版本3.2另一版本前言声明：本文参考了李宏毅机器学习2020年作业例程，基本上是将代码复现了一遍，开发平台是Pycharm社区版2021。开发环境：Anaconda3+Pycharm，python3.6.8。一、问题描述数据可以从Kaggle上获取。链接：Kaggle数据下载作业要求：在收集来的资料中均是食物的照片，共有11类，Brea

李宏毅机器学习作业三

qq_37195826的博客

09-02

1311

前言项目三是训练一个简单的卷积神经网络，实现食物图片的分类。现在还没有完成，在这里做一个记录。第三个作业比前面两个难了不少，遇到了很多困难，首先还是去理解老师已经给出的代码。这里用了paddlepaddle的深度学习框架，代码里碰到很多不懂的api就去paddlepaddle官网找文档然后加了注释。现在代码已经理解了但是运行还有一些错误。数据集分别为training、validation 以及 testing training 以及 validation 中的照片名称格式为 [类别]_[..

李宏毅2021年机器学习作业3（CNN—classification）实验记录

求算法实习

11-16

4041

李宏毅2021年机器学习作业2学习笔记前言一、问题描述二、实验过程2.1 跑助教提供的baseline2.2 加入image-augmentation2.3 修改数据增强部分2.4 在2.3基础上，最后全连接层处理2.5 半监督三、总结前言声明：本文参考了李宏毅机器学习2021年作业例程，开发平台是kaggle notebook。另一个CSDN大佬的博客一、问题描述实质是一个用CNN做多分类问题。 B站作业讲解视频 Kaggle地址一个大佬的代码二、实验过程 2.1 跑助教提供的baseli

Pytorch入门（一）（李宏毅老师作业一2021年春）

rglkt的博客

10-17

789

本篇代码、数据集来源于李宏毅老师的HW1 数据集地址参考代码地址本文通过李老师的第一作业以及提供的参考代码来进行Pytorch入门。本文为入门文，不会涉及具体的网络设计。当我们想使用数据训练一个模型的时候，其实主要分为两个步骤：读取数据、训练模型。那么我们就按照这个步骤进行pytorch使用入门。读取模型 1、使用dataset和dataloader来进行数据读取这是我在参考代码中看到的使用方法，应该也是比较推荐的使用方法。(以下读取已经经过简化，去掉了一些特殊的数据处理） from torch.

李宏毅深度学习教程：深度学习基础与趋势

"李宏毅的深度学习教程PPT提供了300页的详细内容，涵盖了深度学习的基础技术，包括神经网络的变种、训练深度神经网络的技巧、深度学习的下一次浪潮等主题。课件中包含丰富的图片和公式推导，适合初学者和有一定基础...