场景分类识别
sparkexpert
大数据挖掘技术(人工智能)的爱好者
展开
-
Xception场景分类模型的实践
刚好最近在找场景分类精度更高的模型,因此将会对近年来精度更高的模型(tensorflow slim中集成的模型除外)进行逐一测试。Xception: Deep Learning with Depthwise Separable Convolutions ,谷歌去年推出的一篇论文。看了下这篇论文,它是在inceptionVX的基础上演变过来的。上面右侧四个图刚原创 2017-09-27 10:49:32 · 3494 阅读 · 1 评论 -
基于mask-rcnn屏幕图像中指定对象
在很多场景条件下,会有意地将图像中的某些对象进行屏蔽删除处理,传统的抠图的办法需要用到专业的处理软件来处理。看到有基于mask-rcnn的方式来实现屏幕中指定对象的删除,挺有趣的。具体的方法步骤也非常简单:(1)利用mask-rcnn实现语义分割(2)对分割好的图像,对指定类型的图像对象(如人等)进行删除,可以删除一批同类对象,也可以删除指定类别对象中的某一个具体对象。实验测试如下:对上述原图进行...原创 2018-04-03 17:25:38 · 1164 阅读 · 0 评论 -
tensorflow MobileNetV2的目标检测测试
谷歌近期又推出了下一代移动视觉应用 MobileNetV2 ,它在 MobileNetV1 的基础上获得了显著的提升,并推动了移动视觉识别技术的有效发展,包括分类、目标检测和语义分割。MobileNetV2 作为 TensorFlow-Slim 图像分类库的一部分而推出,同时也已经集成到目标检测的包中,同时重要的是提供了预训练模型。1、模型原理 从论文的名字《MobileNetV2: Inv...原创 2018-04-11 17:14:40 · 5812 阅读 · 0 评论 -
NasNet实践:图像识别领域最佳模型
谷歌最近推出的NasNet,是当前图像识别领域的最佳模型,近日对此模型进行复现了下,也大致了解了其原理。这个模型并非是人为设计出来的,而是通过谷歌很早之前推出的AutoML自动训练出来的。该项目目的是实现“自动化的机器学习”,即训练机器学习的软件来打造机器学习的软件,自行开发新系统的代码层,它也是一种神经架构搜索技术(Neural Architecture Search technology)...原创 2018-04-06 21:12:39 · 16935 阅读 · 0 评论 -
图像地点场景类型识别(PlaceCNN)实践
从图像中判断图像场景所处的地点类型,是图像理解的一种常见任务。本质上场景类别标注数据足够的情况下,它可以属于图像分类的一种,因此直接利用现有成熟的网络架构如ResNet就可以实现较高精度的图像涉及场所的识别。 本文实践采自:http://places2.csail.mit.edu/download.html 该数据集涵盖了365种图像场景,同时还提供了多种网络架构的预训练模型,主...原创 2018-04-20 21:18:39 · 24094 阅读 · 17 评论 -
基于Dual Path Networks(DPN)的图像识别模型实践
图像识别模型已经非常多了,但是看到对于DPN的下面表述,动起了将它复现一下的念头:DPNs helped us won the 1st place in Object Localization Task in ILSVRC 2017, with all competition tasks within Top 3. (Team: NUS-Qihoo_DPNs)可见,DPN在2017的ILSVRC比...原创 2018-06-28 20:42:52 · 1876 阅读 · 0 评论 -
基于Tensorflow.js实现浏览器级别的目标识别应用实践
tensorflow.js 是谷歌于今年推出的浏览器级别的深度学习框架,TensorFlow 团队在其github官网上也公开了表示基于网页的 JavaScript 库 TensorFlow.js 库框架及其相关的例子。基于该应用能训练并部署机器学习模型。1、Tensorflow.js介绍 TensorFlow.js 是一个开源的用于开发机器学习项目的 WebGL-accelerated...原创 2018-07-25 18:59:36 · 5100 阅读 · 3 评论