如何将CNN的性能优化十倍

一,人是如何进行视觉信息储存

人通过感官接受到的信息,会和计算机一样,进行编译、转化,再进行储存、使用。

人接受到的视觉图像,会在传递的过程种,分解为形状和参数两种数据。
形状这一词指的是一个物体的轮廓线。
参数这一词指的是一个物体的颜色、所处环境、特殊印记、大小、行为,等等一系列的特征数值。

例如:一只猫的形状,就是把该猫的花色、大小、行为、等参数全部剔除。只留下一个由简单线条组成的猫。
我所说的这个形状,有时连五官都可以忽略。比如,一个猫的头部,只需要用一个圆圈当脑袋,和两个三角做耳朵,就可以勾勒出来,像小学生的涂鸦一样。
而该猫的参数则会储存着,颜色黑白相间,绿色眼睛,大概有三十厘米长,正在草地上蹲着。这样的信息。

当人见过第一只猫以后,就会按照我上面说的过程储存信息。
只要再遇到形状相同的生物,人就可以辨别出这是猫。当然,假设一个人只知道猫,不知道老虎,可能就会存在误判。把老虎也认为是猫。一只特别大的猫。

二,如何应用

以上这种物体识别模式,就是人视觉泛化能力如此强大的根本原因之一。不过哪怕是之一,也有很好的应用效果。
只要我们使用该模式构建一个神经网络,那么我们让计算机在进行物体识别训练时,就不需要大量的样本训练,也不需要大量的时间来优化模型,只要3到5张图,就能让计算机认识一种物体。并且效果甚至可能比别人用几万张图训练的还要好。
也就是说,我们要先写一个,物体轮廓提取的模块。
神经网络接收到图像后,要先经过轮廓提取模块,提取出形状。
这个形状再转化成参数,由神经网络判断属于哪一个类,然后进行分类,最后输出结果。
该结果获取后,就可以确定该物体的大类。然后再将颜色,大小之类的参数添加进来,预测其具体名称。

三,总结

我们并不需要将人工智能每一项能力都超越人类,大部分只要和人类持平就好,我们需要的仅仅是计算机的计算和存储能力与人类智慧的结合。
————本文为博主原创,转载请注明。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值