全文共4049字,预计学习时长8分钟
图片来源:pexels.com/@pixabay
当下,人工智能已逐渐成为影响全球经济的主流因素,而在人工智能的众多细分领域中,计算机视觉发展尤为迅猛。
工业4.0时代
人工智能和机器人技术的进步正在减少机器与人类的差距,但制造出完全类人的机器仍需经历较长的发展历程。工业4.0时代,自动驾驶汽车和无人机正加快发展,同时如相机和图像传感器等先进设备也有革新态势。
先进技术使机器人或自动程序代替人类,将人类从枯燥的简单工作中解放出来,而人类因此获得时间和空间去追求更有价值的工作。
数据是关键
从技术的角度来看,数据是成功组织正运行的数字化转型项目的基石。数据可被认为是人与机器之间的最佳纽带。无论是数字、文本或更加复杂的数据如音频、视频和图像,数字信息使人们可以与机器交流——反之亦然——同时也使机器能“理解”周围的世界。
图片来源:pexels.com/@naveen-annam-734127
什么是计算机视觉
正如术语本身所示,计算机视觉是指一项帮助计算机、软件、机器人或其它任何设备获取、分析及处理图片的技术。图片的可能来源不一而足,可能是照片、视频、3D设备、医疗或工业扫描器等等。计算机视觉旨在帮助这些设备——包括无人机、交通机器或仅仅是一台计算机——根据所获信息进行“可视”和回应。由于计算机视觉的复杂性并考虑到其终端使用案例,其难度常被拿来与语音识别作比较。
你可能对计算机视觉这个概念及其背后的技术不太了解。但是,其中的一项技术光学字符识别OCR应用十分广泛,因为其常用于识别照片中的文字信息或有一定年份的扫描文件。几十年来,银行业为读取支票内容一直使用笔迹识别技术。物品识别长期应用于许多行业,以自动控制质量或为找出一些样品分类工厂产品。
某种意义上,计算机视觉与人工智能联系紧密,因为设备不仅需要识别信息,还要在识别后立即分析和解释所见内容。这是为了采取合适的措施,与周边环境互动。
上世纪60年代早期开始的研究推动了今天人工智能和物联网技术的发展,而计算机视觉也是如此。据夏季视觉项目报告,“构建一个先进的足够复杂的图案识别系统”在1966年得以实现。
计算机视觉 vs 图像处理
注意不要混淆计算机视觉和图像处理。实际上,图像处理一般是指分析数字图像和运行算法,包括分类、提取、编辑和过滤等。图像处理主要通过技术和方法来增加图片信息,而计算机视觉旨在发挥图片的实际用途。
虽然计算机视觉显然与图片管理更为有关,但其可应用于各种操作,包括物品识别和活动监测。
分析师观点
弗雷斯特:“由于有庞大的训练数据集、深度神经网络和图形处理器,计算机如今可以准确识别图像和视频中的物体和特点。首席信息官和技术领袖们需要知道如何将计算机视觉应用于安全保障、社交媒体监测、市场资产管理、生产制造以及对散乱图像数据进行分类等诸多领域。”
德勤:“许多技术公司仍未意识到认知技术正在改变着行业,也并不了解他们自身——或其竞争者可如何在公司策略及运营中应用技术…/…计算机视觉是指计算机能够识别非限制性(即自然性)视觉环境中的物体、场景及活动。”
Arcognizance.com网站:“人工智能与人类智识有关,具有类人特征,如语言理解能力、分析能力、学习能力、问题解决能力等。人工智能是市场上新一代软件技术的核心。前沿技术公司正积极地将人工智能作为其技术发展的必要部分。计算机视觉技术将以最高速度增长,而这得益于其在制造业和汽车业等领域的大量自动化和半自动化应用。”
国际数据公司:“计算机视觉软件技术正在改变传统行业,如汽车业、零售业、保险业和医疗保健等。通过将此技术应用于产品或服务,传统行业可降低成本、提高效率。”
麦肯锡:“人工智能将在未来引起新一轮的数字革命,各大公司应做好准备。技术先行者们已经获得技术红利,其它公司更需要加快数字化转型。[受影响最大的行业中]五大最具创新性的人工智能技术——机器人和自动驾驶、计算机视觉、语言、虚拟代理及机器学习——都包括了深度学习,并为其它人工智能技术夯实基础。
实际案例说明
机器人和自动驾驶汽车等自动化机器曾经是计算机视觉最常应用的领域。然而现在这项技术在越来越多的领域得以应用,如:
医疗业
图案识别和综合图像处理领域技术不断革新。同时,对医疗保健领域人士来说,毋庸置疑的是,在他们获得更好的诊疗工具或提高诊断和治疗水平的所有途径中,医疗图像已成为一重要方式。
医疗图像分析十分有助于预诊和治疗。比方说,结肠镜检查应用计算机视觉技术后,可获得更为有效和可靠的数据,以降低结肠癌死亡率。
再比如,计算机视觉可为外科手术提供技术援助。对脑瘤病人进行3D头骨建模,十分有助于后续神经外科治疗。同时,人工智能正越来越多地应用深度学习,利用其对肺瘤进行分类极其有益于及时诊断出肺癌。
图片来源:pexels.com/@fancycrave
零售业
计算机视觉在实体店铺中也得到越来越多的应用,尤其在提升顾客体验方面。品趣志的Lens是一个搜索工具,利用计算机视觉识别物品,而Shazam也应用此技术识别音乐。在实体商店中使用此手机应用程序,产品会得到视觉化呈现,而你也可以看到其它相关产品。
面部识别是大众十分熟悉的一项计算机视觉的应用,在商场或商铺中均有应用。Lolli & Pops是一家美国糖果商店,运用面部识别技术对忠实顾客进行回馈。“试想一下:你走进最爱的商店,导购对你的身份和需求了如指掌,为你介绍你最感兴趣的产品。”这就是这家商店成功应用新技术后的场景,每一位顾客都能享受到定制化服务。
计算机视觉应用似乎不胜枚举。其还可应用于分析书店读者、商店顾客,甚至消费者情绪。情绪识别基于这样一项算法,该算法抓取视频中的人像对其析微表情进行分析和处理,最终解读出顾客的总体情绪。
商店技术革新的最大目的可能是减少排队结账的顾客。计算机视觉与人工智能结合,最终可消除排长队的噩梦。
亚马逊推出了一项新服务亚马逊无人超市(Amazon Go),应用计算机视觉、物联网、人工智能等技术以识别、跟踪和分析顾客消费行为,并提供自助结账服务和电子收据。
银行业
说到人工智能在银行业的应用,最先想到欺诈监测。虽然这的确是这一领域的重点关注,但计算机视觉的应用不只如此。使用机器学习应用图像识别来分类和提取数据、监管文件授权(如身份证和驾驶证),可提升远程用户体验并保障安全。
无人机火灾监测
计算机视觉同样在安全领域市场上获得了广泛多样的应用。无人机可利用计算机视觉、使用红外线图像增强人类的森林火灾监测能力。先进算法对视频图像特点进行分析,如动作和亮度,从而监测火灾。该监测系统提取和分析特定图像,有助于识别模型和分辨林火与动态的区别。后者很容易被识别为火灾。同时,无人机代替消防队员在危险区域进行监测和研究,有助于保障其安全和提升效率。无人机借助先进算法对浓烟和火势进行分析,以评估灾情蔓延的风险。
前沿技术生态系统
ResearchAndMarkets网站研究报告显示,“计算机视觉市场中人工智能应用2018年估值达到36.2亿美元,2023年将达到253.2亿美元。”
计算机视觉涵盖的技术十分广泛,其中包括图像识别。图像识别应用于识别物体、人物、动作等,之后再交由机器学习和云计算在CPU、内存和边缘计算等方面进行处理。这正如自动化无人机一样,其需要在创建初始阶段进行处理。机器学习和深度学习技术尤其推动了计算机视觉的发展。
机器学习
机器学习是一种提高应用精确度的算法。有趣的是,这些算法并不需要十分清楚的执行计划。基于数据引入流、重复出现数据以及先进的分析,机器学习能不断改善输出结果。
机器学习十分依赖于数据集。简单来说,数据集即一组相关数据,其结合可增加价值,引入新数据也更为简单。
计算机视觉生态系统正在为技术人员提供大量免费图像数据集。比方说,哥伦比亚大学图片库共享一组数据集,其包含对100个物体360度全方位的图像记录(COIL-100)。
深度学习
深度学习是人工智能下的一个分支,基于人类通过学习达到对事物更深理解的能力和原则。因此,深度学习提供了改善过程的可能,包括提升计算机视觉输出结果的精确度。
深度学习算法依赖于神经网络,以此来描绘分支过程,并形成概念等级。这些复杂概念再次被分类为更为简单的概念组。
图片来源:pexels.com/@ivandrei-pretorius-457987
面部识别
面部识别是指通过深度学习算法描绘和储存电子身份。此种生物识别可与虹膜、指纹识别等技术相媲美。
据称,2011年谷歌公司证明可以仅依靠未标记图像创建面部识别装置。谷歌设计了一套系统,该系统可自主学习识别猫的图像,而且并不需要知道猫的外形。
当时,神经网络包括1000台电脑,由16000个内核组成。1000万随机Youtube视频得到输入…J.迪恩博士(Dr. J. Dean)是项目参与者之一,他在接受《纽约时代》杂志采访时说,团队从未向系统说明“这是一只猫”,因此系统“自主创造出猫的概念”。
日常生活中的计算机视觉
今天,智能手机可使用高像素相机进行识别。比方说,iPhone X应用面部识别技术解锁屏幕。用户的面部ID数据被加密和储存到云端,而当其进行购买操作时可使用面部ID进行授权。
中国的技术专家们正在进行一项计算机视觉技术研究,并将其应用到日常生活中。不仅中国的消费者更愿意使用智能手机及其面部识别技术进行购买,这项技术也有助于识别和抓捕罪犯。
计算机视觉对人类意味着什么?
计算机视觉应用于安全领域,有助于搜索罪犯。其还可预测人群拥挤等紧急情况,以保障城市安全。
通过研发更多更为复杂和先进的计算机视觉算法,语言识别的发展势必会得到推动,因为二者都是基于相似的原则。这些都将增强人工智能和机器人的情景意识。
加强深度学习和机器学习算法的能力总会引致相关担忧,至少是某一主题会受到特别关注。实际上,这与隐私和道德问题有关。
然而,这并不意味着所有研究应该作罢。相反,就像其它技术发展进程,计算机视觉的发展须受到全球各方的集体监管,而非由某一行业、军事力量或强国垄断。
留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”
(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)