面向初学者的10个热门计算机视觉项目
小白学视觉 昨天
以下文章来源于新机器视觉 ,作者新图视觉
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
人工智能最具挑战性的课题之一是计算机视觉技术。近年来,随着计算机视觉应用的日益广泛,计算机视觉技术在机器人、监控、医疗等领域得到了广泛的应用。
在本文中,我们列出了十个流行的计算机视觉项目以及它们的可用数据集,供初学者学习:
1、 颜色检测
在此项目中,模型的目标是检测图像中的每种颜色。模型的目标是检测图像中的每种颜色,一种流行的颜色检测项目是使用OpenCV的隐形斗篷。
数据集:Google-512数据集
链接:https://cvhci.anthropomatik.kit.edu/~bschauer/datasets/google-512/
2、 边缘检测
边缘检测是一种图像处理技术,用于检测图像中的边缘以确定图像中对象的边界。该技术通过检测亮度不连续确定边缘。一些常见的边缘检测算法包括Canny,模糊逻辑方法等。
数据集:USC-SIPI图像数据库
链接:http://sipi.usc.edu/database/
3、 人脸检测
在此项目中,该模型的目标是通过映射视频或图像中的面部特征来检测人的面部。这些项目涉及多个步骤,例如映射功能,使用主成分分析(PCA),将数据与数据库进行匹配等等。
数据集:IMDB Wiki数据集
链接:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
4、 手势识别
手势识别是人机交互的关键主题之一。在该项目中,需要执行几项任务。这包括要从背景中提取的手部区域,然后将手掌和手指分段以检测手指的运动。手势识别的应用可以用于虚拟现实游戏,手语等。
数据集:Microsoft Kinect和Leap Motion数据集
链接:https://lttm.dei.unipd.it/downloads/gesture/
5、 人员计数
此项目的目的是计算通过特定场景的人数。该项目的应用包括民用监视,行人跟踪,行人计数等。
数据集:人员计数数据集(PCDS)
链接:https://github.com/shijieS/people-counting-dataset
6、 图像分割
图像分割是图像处理的一项必不可少的技术。该技术可用于计算机图形学,对象合成等。该项目的目的是基于分割算法在一组图像上的多个区域上设计,实现和测试。
数据集:伯克利细分数据集和基准
链接:https://www2.eecs.berkeley.edu/Research/Projects/CS/vision/bsds/
7、 图像分类
该项目的目的是对定义了一组目标类别的图像进行分类。这是一个有监督的学习问题,其中训练模型以使用标签图像识别类别。
数据集:CIFAR-10数据集
链接:http://www.cs.toronto.edu/~kriz/cifar.html
8、 图像着色
图像着色是一种为照片增添样式或对照片应用多种方法的技术。图像着色的一个流行项目是使用OpenCV转换黑白图像。该项目的目的是通过获取输入灰度图像来生成表示语义颜色和色调的输出彩色图像。
数据集:图像着色数据集
链接:https://www.kaggle.com/shravankumar9892/image-colorization
9、 对象追踪
该项目的目的是在受限环境中开发对象跟踪系统。这包括从背景检测对象并跟踪对象的位置。对象跟踪包括两部分-预测和校正。系统根据对象的当前状态预测其下一个状态,并根据真实状态校正该状态。
数据集:跟踪Long和Prosper–TLP数据集
链接:https://amoudgl.github.io/tlp/
10、 车辆计数
该项目的目的是即使在与遮挡和/或阴影存在相关的挑战性场景中,也能以非常好的准确性对车辆进行计数。车辆计数项目可用于交通监控。
数据集:车辆图像数据集
链接:https://www.gti.ssr.upm.es/data/Vehicle_database.html