计算机视觉:计算机采用算法对图像进行处理。
分类,检测,分割
图像分类,即图像识别,分类的进步引领了计算机视觉的进步
OpenMMlab的训练框架是pytorch,开源了大量的算法框架,我个人对MMEditing比较感兴趣。MMEditing在像素层级上进行处理,可以进行图像修复,抠图,图像生成等操作。
OpenMMlab上的算法都是已经复现过的,开发者不需要自行重现已有算法,可以直接调用了。
openmmlab三宝:基于pytorch开发,模型库和数据集可以直接作为学习路径,算法包括前沿论文。
机器学习和神经网络简介:
神经网络的训练:确定损失函数,调整w降低损失函数,最优化问题。
训练流程:1.计算样本的损失 2.计算样本损失的梯度 3.根据梯度信息更新函数
常用损失函数:交叉熵损失
基于梯度下降算法寻找最优参数,降低损失函数。
卷积神经网络: