摘要:随着计算机等技术的不断发展,计算机视觉技术被广泛运用到各个领域中。与此同时,随着人口数量的增长、城市化进程导致耕地面积的减少,农业向着高质量、高产量方向的发展成为关键。将计算机视觉技术应用在农业领域能够在一定程度上降低虫害等对农业的影响,推进农业向着高质量、高产量的方向不断发展。本文简要回顾计算机视觉领域的几个重要任务和方法,介绍当前计算机视觉技术在农业领域中的应用。
关键词:计算机视觉;农业;深度学习
一、引言
从2016年AlphaGO战胜人类围棋冠军李世石,到2017年升级版的AlphaGO战胜世界排名第一的棋手柯洁,AlphaGO也从Lee版本发展到Master版本再到Zero版本[1, 2],最终来到基于强化学习的Alpha Zero,人工智能得到越来越多的关注。计算机视觉,利用计算机强大的计算能力去感知世界,并作为人工智能的一个重要分支,在整个人工智能发展史上有着重要作用。随着深度学习时代的来临,计算机得以在视觉相关的任务中取得优于人类的表现,2015年Microsoft Research提出的ResNet夺得ImageNet挑战赛中分类任务冠军并首次超越人类在该任务中的表现[3]。
计算机视觉技术不断发展,在各项视觉任务中取得优异表现,也使其被应用于多个领域,如医疗、交通等。2018年,加州大学圣地亚哥分校张康教授团队使用基于图像的深度学习工具对疾病等进行诊断,在多个任务中超越人类专家,该项研究成果被刊登在《Celll》杂志封面[4];随着无人驾驶、智慧城市等的发展,计算机视觉也被广泛应用于交通领域用于缓解城市道路拥挤、减少交通事故等。
此外,据不完全估计地球总人口将在2050年突破100亿,人口的爆炸式增长必将带来食物需求的增加,环境的破坏会使得全球气候恶劣、温室效应等,同时城市化进程使得耕地面积减少。人类对食物的需求、对饮食质量的要求,与耕地面积、气候环境构成了矛盾,人类需要用更少的土地种植出更多更好的农产品以满足人类发展的需求。人工智能技术尤其是计算机视觉技术,结合基因组学、植物表型、农业工程等使得这一矛盾得以解决,大力推进农业向着高质量、高产量的方向不断发展。
二、计算机视觉
计算机视觉,(Computer Vision, CV)是一门研究如何使机器“看”的科学,其以图像(视频)为输入,以对环境的表达(representation)和理解为目标,研究图像信息组织、物体和场景识别等,包括但不限于物体分类、物体检测、物体分割、物体追踪、三维重建等。
2.1 视觉任务
图1 计算机视觉经典任务(来源:斯坦福cs231n)
物体分类(Object Classification)任务要求回答图像中是否包含某种物体,如一张图像中的动物是猫还是狗。物体检测(Object Detection)任务不仅需要识别出图像中所含物体的种类,而且需要指出该物体所处的位置并且使用边框(Bounding Box)标出。物体分割(Object Segmentation)任务在尺度上更细,往往在像素尺度进行分类,将不同的物体分割。
图2 物体分割
计算机视觉中,一个场景的二维表示往往会丢失物体的某些信息,而三维表示能够更全面地描述一个场景或者物体,所以有一些研究者将目光聚焦在同时定位与地图创建(Simultaneous Localization and Mapping, SLAM)、三维重建(3D Reconstructi