【计算机科学】【2016.02】基于卷积神经网络的人物分类

在这里插入图片描述
本文为奥地利维也纳科技大学(作者:Georg Sperl)的硕士论文,共86页。

大规模目标识别挑战,如ImageNet大规模视觉目标识别挑战或Microsoft上下文中的公共目标挑战,表明卷积神经网络在目标检测和图像分类等计算机视觉问题上取得了最新的性能。卷积神经网络受益于数十万幅图像的数据集,这些数据集覆盖了更多的类内变化,有助于学习鲁棒和不变特征。然而,这些数据集被设计用于一般的物体识别,并且没有类似尺寸的数据集存在于人物识别中。因此,从30多个数据集中收集数据,用于人的检测、分类、分割和跟踪,形成一个用于人物识别的数据源池。提出了一种从该库中提取特定应用数据并训练卷积神经网络进行二值人物分类的方法。此外,分析了非人类对子类标记的性能改进,得到了2.82%的错误率。结果表明,使用我们的人物识别数据集作为人分类任务的预训练集,训练集只有几千幅图像,可以提高8%以上的准确率,总的准确率超过99%。我们的数据集质量通过额外的评估得到了证明。此外,研究结果强调卷积神经网络架构选择的复杂性,并指示在初始化和求解算法的子类标记训练中增加鲁棒性。

Large-scale object recognition challenges such as the ImageNetLarge Scale Visual Object Recognition Challenge or the Microsoft Common Objectsin Context challenge have shown that convolutional neural networks achievestate-of-the-art performance on computer vision problems like object detectionand image classification. Convolutional neural networks benefit from datasetsof hundreds of thousands of images, which cover more intraclass variabilitiesand aid in learning robust and invariant features. However, these datasets aredesigned for general object recognition and no dataset of similar dimensionsexist for person recognition. Therefore, data is collected from over 30datasets for person detection, classification, segmentation and tracking toform a pool of data sources for person recognition. A method of extractingapplication-specific data from this pool and training a convolutional neuralnetwork for binary person classification is proposed. Additionally, performanceimprovements of subclass labeling are analyzed for the nonperson class and anerror rate of 2.82% is achieved. Results demonstrate that using our personrecognition dataset as a pre-training set for person classification tasks withtraining sets of only up to a few thousand images leads to an increase inaccuracy of over 8% to a total accuracy of over 99%. The quality of our datasetis demonstrated by additional evaluation. Furthermore, results emphasize thecomplexity of convolutional neural network architecture choice and indicateincreased robustness in training with subclass labeling with regards toinitialization and solver algorithms.

  1. 引言
  2. 卷积神经网络
  3. 人物识别
  4. 相关工作
  5. 研究方法
  6. 具体实现
  7. 评估与结果
  8. 结论

更多精彩文章请关注公众号:在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕业设计,基于SpringBoot+Vue+MySQL开发的公寓报修管理系统,源码+数据库+毕业论文+视频演示 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本公寓报修管理系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员提高事务处理效率,达到事半功倍的效果。此公寓报修管理系统利用当下成熟完善的Spring Boot框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的MySQL数据库进行程序开发。公寓报修管理系统有管理员,住户,维修人员。管理员可以管理住户信息和维修人员信息,可以审核维修人员的请假信息,住户可以申请维修,可以对维修结果评价,维修人员负责住户提交的维修信息,也可以请假。公寓报修管理系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问题提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。 关键词:公寓报修管理系统;Spring Boot框架;MySQL;自动化;VUE
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值