小白的学习之路-Datawhale X 李宏毅苹果书AI夏令营 打卡第二次

作为一个ai与csdn小白,第四次发文章进行打卡,无比激动和紧张,不知道该说些什么,如有任何问题望各位大佬海涵,多多指导,我虚心接受各位的建议。

前情提要

上篇文章的结尾;“感觉有点改进但还是有点乱,打算再改动一下试试,结果下次再更新吧。”最近还是有点忙,又鸽子了。没关系,这次继续来说说,卷积神经网络的知识吧。

学习内容

        图像被图像处理之后,模型输出的结果经过一个softmax(一种激活函数最后输出的结果和为1),输出的矩阵(只有一列如上图所示)与这张图片的标签对应得矩阵做一个交叉熵损失(也是一个很长的一维矩阵,只有图片对应得类别的值为1,其他值为0),然后就得出了一个差值,最后通过训练使这个值越小越好。

但是问题就来了如何将图片输入呢?计算机是怎么识别出来图像的呢?

        在计算机的看来图片长这样,一个三维的tensor:一个维度是长,一个维度是宽,一个维度是表示颜色的rgb三通道。

        最简单的方式是把整个tensor每一个值都给neuron,同样这意味着会产生同样多的权重weight,权重过多虽然会加强模型的弹性,但是同时也会增加过拟合的风险,而且也会增加计算的消耗吧(这个原因视频里没有,是笔者自己想的)

        那应该采取什么方式呢?

其实人类观察一张图片的类别是通过看一些特定的特征,比如鸟的嘴,爪等等

不信看看下面这张图片

所以我们也可以只用一个neuron读取图像的部分信息,这样也可以提取特征

    后记

其实说到这还有很多问题没有解决,比如,如果图像的相同特征在不同位置怎么办。。。

时间有限就到这吧,如果大家有兴趣可以自己去看看老师的课程,或者也许我会更新一些后续内容

大家加油!

如果在上述引用的图片涉及侵权问题,请联系我删除

        

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值