计算机视觉自学

学习资料

课程&笔记

1.b站,斯坦福李飞飞的cs231n计算机视觉课程
2.该课程的文字版笔记
斯坦福CS231n李飞飞计算机视觉Lecture 8笔记
  因为就算有中文字幕,我还是觉着有点听不懂,可能一方面是不是同一个老师讲,另一方面是语言上的表达差异,当然也完全可能是因为我太菜了,偏偏又不喜欢听课,喜欢直接看文字。
  这位大佬的博客里面有文字版的资料,非常有帮助。
3.辅助书籍——鱼书
  计算机视觉这本处理图片的比较多,有点像简单ps,但也有一些结合了神经网络的部分;入门的介绍比较简单易懂;进阶嘛,不好意思,还没看,听说是opencv的。

编程

  大部分编程书里有,但会因为版本问题不一样,多找csdn上的博文看看。这位大佬呢由计算机视觉的部分,方便你们复制了计算机视觉书上代码
  当然,我自己也做了一些,写了一些,叫做“用Python处理图像自学”

自己的小总结

总结一点学习中的名词
1.数据驱动:搞个训练集,得到个能把图片分类的分类器,然后搞个测试集看下效果如何。

2.K-临近算法(KNN):距离样本i最近的有K个样本,这K个样本大部分属于哪一类,K就属于哪一类。

3.线性分类:也就是我们所认识的神经网络,要有权重w和偏置参数b

4.梯度下降(GD):获得正确的W和b

5.随机梯度下降(SGD):就每次随机选一个mini-batch算梯度。

6.mini-batch:如果说你的数据量很大,那我们就分小组,方便计算。

7.反向传播:类似于王牌里的比动作传字谜游戏,反向传播就是把字谜给最后一个人看,然后最后一个人告诉倒数第二个人描述要注意什么。

8.卷积神经网络(CNN):卷积形象点就是用一个小方块在大方块上面扫,做点数学运算。
  其结构一般是:输入-卷积层(提取数据特征)-池化层(选择特征并过滤信息,减少计算量)-全连接层-输出
  计算的时候有个公式output=(input+2*pad-kernel)/stride+1

9.训练神经网络:
①激活函数——就各种函数图象,各有特点,让你用了之后控制数据的范围,比如某一个函数在正半轴的值全为0
②权重初始化——以0为均值,1为标准差的高斯分布
③批量归一化——训练开始前通过一个网络,使数据服从高斯分布
④正则化——防止过拟合(完美无瑕叫做过拟合)
⑤数据扩充——与其到处找数据,不如自己搞,比如把原图镜像一下,转个几度就又是一张新图

10.循环神经网络(RNN):CNN的前后输入是没关系的,但这样的话就好像脱离语境理解词汇,没办法确定是动词还是名词,而RNN恰好弥补这一点。

其他的,你觉得我会??!!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值