计算机视觉算法基础与OpenMMLab介绍-笔记

文章介绍了CV的任务,包括分类、检测和分割,并提到了OpenMMLab这一基于PyTorch的计算机视觉算法体系。同时,概述了机器学习的基础,如监督、无监督、强化和自监督学习,以及神经网络在非线性分类中的作用。文章强调了特征提取、决策边界求解和反向传播在模型训练中的重要性。
摘要由CSDN通过智能技术生成

CV的任务

分类 :属于哪一类物体

检测 (目标检测 关键点检测):每个物体用框框起,并注明名称

分割(语义分割 实例分割):后者需要区分每一个物体

后三者需要精准的定位图像上的每一个像素点

OpenMMLab

是深度学习时代最完整的计算机视觉算法体系,基于pytorch研发,总体架构概览如下图,可以大大节省论文阅读时间,更快捷的去了解一个领域的相关内容

机器学习和神经网络简介

机器学习的基础

让计算机从数据中学习经验,以解决特定问题

为什么要让机器学习呢,人脸识别、机器翻译、语音识别、强化学习这些可以看出,不同的数据模态对应不同的算法,考虑到问题的复杂度以及算法的鲁棒性,让机器从大量的数据中学习,通过数据驱动的方法去学习、去拟合、去归纳、去挖掘,从而可以解决复杂问题。

机器学习的典型范式包括:监督学习(有lable)、无监督学习(无 lable)、强化学习(自己去适应环境)、自监督学习(计算机自己找lable)

机器学习中的分类问题

例如对于垃圾信件的分类,垃圾邮件分类器首先提取、统计关键词,形成词频向量,用词频向量代表一个文本,成为特征。也就是说把不同的数据模态(语音、文字、图片)转成向量(特征),再由向量特征去学习n维空间的一个决策(分类)边界,如果拟合出来的分类边界是一条直线,称为线性分类器(假设类别和特征之间存在某种线性关系,即不同类的数据在特征空间中可以被一条线分开)。

W是权重向量

关键是如何求分界面,用标注的数据去预测得到损失函数的值,再按照使得损失函数最小化的方向去迭代的优化这些权重,然后经过随机梯度下降的不断的迭代训练最终收敛得到一个完美的决策边界。感知器算法(神经网络的雏形)其实也是一个线性分类器,可以作为神经元的一个基础单位。

机器学习的基本流程如下:

在训练集(平时的考试题)上训练,再拿到验证集(高考题)上去验证或者是拿到测试集上去评估,最后把它部署到真实的应用场景里。

神经网络

一种拟合能力很强的函数,是非线性分类器

神经元的构成如下:

神经网络是通过反向传播和梯度下降来求解的

基于梯度下降算法寻找最优参数,进而得到最优(性能最好)的网络

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值