读《改变未来的九大算法》-约翰.麦考密克 之图像识别技术

一.有关图像识别---从经验中学习

 分析引擎(analytical engine)没有原创任何东西的权利,它只能执行我们的指令。---------艾达.勒夫蕾丝

试想下:如果让你手动计算数十亿网页的pagerank权重,你能完成吗?但计算机可以。image recognition field is including face recognition,object recognition,speech recognition and handwriting recognition etc.让计算机判定一张照片是不是你的姐妹或者手写信封上的城市等,这些对计算机来说很容易,但是计算机缺乏原创性,它们必须严格遵循人类程序员的指令。这里主要讲到三种算法:最近邻分类器、决策树及神经网络

思考:人脑能快速处理很多事情,计算机程序能吗?

计算机及人脑很多都是没有一些内建知识,而是通过后天学习得到的,这样的程序就不是程序存储控制,所以后来科学家就采取了另一种策略:让计算机自动“学习”,基本策略是给计算机标记大量数据(labeled data),通过学习已知分类的特征得到每个类的特性,之后提供一些未标记的样本,来推测可能的类。因此,图像识别分为两个阶段:训练阶段和分类阶段

1.最近邻分类

思考:你能根据一个人的家庭住址,预测那个人会向哪个政派捐赠?这个问题看似很荒唐,但是给到计算机后这个问题也可以做,用什么方法呢?最近邻分类就是最好的方法:首先在训练数据中寻找该样本的最近邻 ,其次将最近邻所属的类作为你的预测,这种方法主要是通过地理距离衡量分类依据。那要衡量不同类之间的距离怎么做呢?这时候就不能使用地理距离来衡量 了,而是衡量数字图像间的区别度

2.决策树
思考:现在让你心中想一个数,之后我只通过你回答“是否”来知道你想的那个数,是不是很神奇?其实啊,就是运用了决策树的原理。决策树在“网络垃圾”应用领域很重要,现在很多网站的操作人员试图通过人为制造链向特定页面的超链接,操纵搜索引擎的排名算法,他们主要是通过创建拥有特别修饰内容,但其实搜索的结果对你一点用都没用的网页进行干扰(如:加入大量流行词)。那决策树怎么帮助搜索引擎进行辨别和消除网络垃圾呢?首先还是需要大量训练数据(网页),手动将其标记为“垃圾”和“非垃圾”,并训练分类器。

3.神经网络

最早使用计算机模拟人脑的讨论,是由英国科学家阿兰.图灵发起的,其经典论文《计算机器与智能》(computing machinery and intelligence)以其对计算机是否能伪装成人类的哲学探讨而闻名于世。这篇论文介绍了评估计算机和人之间相似性的一种科学方法,也就是如今周知的“图灵测试”(turing test),并分析了使用计算机模拟人脑的可能性,要了解神经网络必须先了解生物神经网络,了解其信号是如何传输的,神经元(neuron)是如何工作的,其工作机制是什么?如输入信号的兴奋性(excitatory)、抑制性(inhibitory)。那么人工神经网络(artifical neural network)在图像识别方面的应用是非常广的,可如果难度较大,可以通过增强加权信号:信号只能携带0和1之间的任意值输入总和,通过加权求和计算(神经网络考虑每个连接强度不同的情况,一般称为权重,大的正权重代表了强烈的兴奋性连接,大的负权重代表强烈的一致性连接,权重较小,权重的大小是相对而言的);阈值的作用被软化。通过学习调整神经网络,主要是通过权重值来调节。神经网络的学习接管相当耗费精力,涉及到对所有权重和阈值的反复调整,直到网络在训练样本上运作良好--这些都能被计算机自动完成。

4.三种算法的比较

决策树分类器学习过程可以很复杂,但却是全自动的,而且我们只需要做一次,因此分类阶段精度高效。

这三种算法在实际应用中非常广泛,如可以纠正虚拟键盘上胖手指文本输入、从一份负责的检验结果中帮助诊断病人疾病,在自动收费亭识别汽车牌照等等,未来将会有更多有效的算法应用于生活中,但是人工智能真的在未来某一天会替代人吗?会产生更多的商用价值吗?这个需要时间的检验。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值