计算机视觉自学

最新推荐文章于 2024-04-17 22:01:19 发布

LareinaLiang

最新推荐文章于 2024-04-17 22:01:19 发布

阅读量219

点赞数

分类专栏： YJS自学路文章标签：计算机视觉

本文链接：https://blog.csdn.net/weixin_44290677/article/details/117293301

版权

YJS自学路专栏收录该内容

8 篇文章 0 订阅

订阅专栏

计算机视觉自学

学习资料

学习资料

课程&笔记

1.b站，斯坦福李飞飞的cs231n计算机视觉课程
2.该课程的文字版笔记
斯坦福CS231n李飞飞计算机视觉Lecture 8笔记
因为就算有中文字幕，我还是觉着有点听不懂，可能一方面是不是同一个老师讲，另一方面是语言上的表达差异，当然也完全可能是因为我太菜了，偏偏又不喜欢听课，喜欢直接看文字。
这位大佬的博客里面有文字版的资料，非常有帮助。
3.辅助书籍——鱼书
计算机视觉这本处理图片的比较多，有点像简单ps，但也有一些结合了神经网络的部分；入门的介绍比较简单易懂；进阶嘛，不好意思，还没看，听说是opencv的。

编程

大部分编程书里有，但会因为版本问题不一样，多找csdn上的博文看看。这位大佬呢由计算机视觉的部分，方便你们复制了计算机视觉书上代码
当然，我自己也做了一些，写了一些，叫做“用Python处理图像自学”

自己的小总结

总结一点学习中的名词
1.数据驱动：搞个训练集，得到个能把图片分类的分类器，然后搞个测试集看下效果如何。

2.K-临近算法（KNN）：距离样本i最近的有K个样本，这K个样本大部分属于哪一类，K就属于哪一类。

3.线性分类：也就是我们所认识的神经网络，要有权重w和偏置参数b

4.梯度下降（GD）：获得正确的W和b

5.随机梯度下降（SGD）：就每次随机选一个mini-batch算梯度。

6.mini-batch：如果说你的数据量很大，那我们就分小组，方便计算。

7.反向传播：类似于王牌里的比动作传字谜游戏，反向传播就是把字谜给最后一个人看，然后最后一个人告诉倒数第二个人描述要注意什么。

8.卷积神经网络（CNN）：卷积形象点就是用一个小方块在大方块上面扫，做点数学运算。
其结构一般是：输入-卷积层（提取数据特征）-池化层（选择特征并过滤信息，减少计算量）-全连接层-输出
计算的时候有个公式output=(input+2*pad-kernel)/stride+1

9.训练神经网络：
①激活函数——就各种函数图象，各有特点，让你用了之后控制数据的范围，比如某一个函数在正半轴的值全为0
②权重初始化——以0为均值，1为标准差的高斯分布
③批量归一化——训练开始前通过一个网络，使数据服从高斯分布
④正则化——防止过拟合（完美无瑕叫做过拟合）
⑤数据扩充——与其到处找数据，不如自己搞，比如把原图镜像一下，转个几度就又是一张新图

10.循环神经网络（RNN）：CNN的前后输入是没关系的，但这样的话就好像脱离语境理解词汇，没办法确定是动词还是名词，而RNN恰好弥补这一点。

其他的，你觉得我会？？！！