[OpenMMLab]AI实战营第一节课

乐乐要当航天猿

已于 2023-02-02 23:28:54 修改

阅读量162

点赞数

分类专栏：无所不能的OpenMMLab 文章标签：人工智能深度学习

于 2023-02-02 23:01:09 首次发布

本文链接：https://blog.csdn.net/LY_970909/article/details/128858907

版权

无所不能的OpenMMLab 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

计算机视觉与OpenMMLab开源算法体系

计算机视觉是什么

计算机视觉是一门让计算机学会“看”的学科，研究如何自动理解图像和视频中的内容

计算机视觉的发展

1960-1980 边缘检测

1990-2000 统计机器学习与模式识别（以人工设计特征算子为主导）

2006-2010 ImageNet诞生

2012-至今深度学习时代

OpenMMLab

在这里插入图片描述
OpenMMLab2.0优势：

1、提供统一先进的底层架构
2、覆盖计算机视觉众多方向
3、提供最经典、最前沿的算法支持
4、提供统一的基准和开箱即用的工作

OpenMMLab2.0特性：

通用：
OpenMMLab2.0架构提供了强大的训练器Runner2.0：负责构建模型、数据等组件，各算法库构造Runner即可；

统一：
1、模块抽象，清理了函数式定义，在MMEngine、MMCV中增加模块或模块方法；
2、训练流程，统一20多个算法任务的训练流程，支持自监督、半监督、少样本训练；
3、数据接口，N个算法库，一套接口定义；多模态、多任务训练的统一接口；半监督、自监督、少样本学习的统一接口。

灵活：
1、统一信息交流渠道；
2、优化和数据增强策略动态调整；
3、任意位置信息能进行可视化分析。

机器学习和神经网络简介

机器学习基础

分类问题

1、线性分类器：
$h_{w, b}(x)=w^{\mathrm{T}} x+b=\left(w_{1}, w_{2}, \ldots, w_{d}, b\right)\left(\begin{array}{c} x_{1} \\ x_{2} \\ \ldots \\ x_{d} \\ 1 \end{array}\right)$
其中权重组成的向量为分界面的法向量，线性分类器组成感知器，利用分错样本对权重进行修正：
$w\leftarrow w+\alpha x_i y_i$
2、神经网络

添加非线性激活函数，使其能够解决非线性分类问题，堆叠多层即为多层感知器，单一分类则结果为一个输出即可；若多分类任务，则激活函数使用softmax，保证每个类别输出大于0，输出概率和为1
$\operatorname{softmax}(x)_{i}=\frac{e^{x_{i}}}{\sum_{j=1}^{n} e^{x_{j}}}$

神经网络的训练

在这里插入图片描述

神经网路的训练，即找到最好的可学习参数值，其流程为：计算样本的损失 -> 计算样本损失的梯度 -> 根据梯度信息更新参数

1、loss – 衡量神经网络的性能

交叉熵损失 Cross-Entropy Loss 输入 $P$ 为 $so f t ma x$ 概率输出， $y$ 为类别真值
$L(P,y)=-logP_y$
2、梯度下降算法

基于梯度下降算法寻找最优参数，即沿着损失函数曲面的负梯度方向下降

3、梯度计算

复合函数求导的链式法则

问题与改进：

1、随机梯度下降，每次选取一部分样本，梯度取均值来计算；
2、优化器，Momentum，梯度计算时，保留一定上一步的移动，避免陷入局部极小值和鞍点；
3、自适应优化器，Adam；
4、欠拟合、过拟合、拟合，与模型参数量与数量之间关系有关；
5、早停，当验证集的分类精度达到最值时，停止训练，防止过拟合；