使用Tensorflow Object Detection 的目录及数据集分析

使用Tensorflow Object Detection 的目录及数据集分析

转载:转载链接

一.源码框架简介:

1.object detection

进入github中可以看到实现的功能非常多:
在这里插入图片描述
其中,official文件夹是官方例程API的集合,都已经经过了优化和稳定性测试。research文件夹是我们的重点,其中的object detection 是物体识别。object detection是基于slim模型分类后的目标识别。
research文件夹API如下
adversarial_crypto:用对抗性神经密码术保护通信。
adversarial_text:带有对抗训练的半监督序列学习。
attention_ocr:用于实际图像文本提取的模型。
audioset:模型和与使用支持代码 AudioSet。
autoencoder:各种自动编码器。
brain_coder:强化学习的程序综合。
cognitive_mapping_and_planning:用于视觉导航的基于空间存储器的映射和规划架构的实现。
压缩:使用预先训练的残余GRU网络压缩和解压缩图像。
cvt_text:使用跨视图训练的半监督序列学习。
deep_contextual_bandits:使用深度神经网络和Thompson采样的各种上下文绑定算法的代码。
deep_speech:自动语音识别。
deeplab:语义图像分割的深度标注。
delf:用于图像匹配和检索的深层局部特征。
differential_privacy:训练数据的差异隐私。
domain_adaptation:域名分离网络。
fivo:过滤用于训练生成序列模型的变分目标。
gan:生成对抗网络。
im2txt:用于图像字幕的图像到文本神经网络。
开始:用于计算机视觉的深度卷积网络。
keypointnet:通过端到端几何eeasoning [ demo ] 发现潜在的3D关键点。
learning_to_remember_rare_events:用于深度学习的大型终身内存模块。
learning_unsupervised_learning:元学习无监督学习更新规则。
lexnet_nc:名词复合关系分类的分布式模型。
lfads:用于分析神经科学数据的顺序变分自动编码器。
lm_1b:十亿字基准的语言建模。
lm_commonsense:使用语言模型的常识推理。
maskgan:使用GAN生成文本。
namignizer:识别并生成名称。
neural_gpu:高度并行的神经计算机。
neural_programmer:用逻辑和数学运算增强的神经网络。
next_frame_prediction:通过交叉卷积网络的概率未来帧合成。
object_detection:在单个图像中本地化和识别多个对象。
pcl_rl:几种强化学习算法的代码,包括路径一致性学习。
ptn:用于3D对象重建的透视变换器网。
marco:自动化结晶实验的评估。
qa_kg:用于知识图上问答的模块网络。
real_nvp:使用实值非体积保持(真实NVP)变换的密度估计。
螺纹钢:离散潜变量模型的低方差,无偏梯度估计。
resnet:深度和广泛的剩余网络。
seq2species:读取级分类学分类的深度学习解决方案。
skip_thoughts:递归神经网络句子到矢量编码器。
slim:TF-Slim中的图像分类模型。
street:使用Deep RNN从图像中识别街道的名称(在法国)。
swivel:用于生成单词嵌入的Swivel算法。
syntaxnet:自然语言语法的神经模型。
tcn:从多视图视频学习的自我监督表示。
文本:用于文本摘要的注意模型的序列到序列。
变换器:空间变换器网络,它允许对网络内的数据进行空间操纵。
vid2depth:从单眼原始视频无监督的学习深度和自我运动。
video_prediction:用神经平流预测未来的视频帧。

我们可以删除其他API,只保留下object detection 以及slim

2.VOC2012数据集:

OC2012数据集分为20类,包括背景为21类,分别如下:

Person: person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下载完成后,可以看到文件夹如下:
在这里插入图片描述

在这里插入图片描述
其中在图像物体识别上着重需要了解的是Annotations、ImageSets和JPEGImages。
Annotations:所有图片的.xml文件
ImageSets:test.txt,val.txt,val.txt.train.txt等文件
JPEGImages:图片

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值