使用Tensorflow Object Detection 的目录及数据集分析

最新推荐文章于 2023-12-30 19:48:19 发布

地瓜埋地下

最新推荐文章于 2023-12-30 19:48:19 发布

阅读量283

点赞数

原文链接：https://blog.csdn.net/weixin_42749767/article/details/82986650

版权

使用Tensorflow Object Detection 的目录及数据集分析

转载：转载链接

一.源码框架简介：

1.object detection

进入github中可以看到实现的功能非常多：
在这里插入图片描述
其中，official文件夹是官方例程API的集合，都已经经过了优化和稳定性测试。research文件夹是我们的重点，其中的object detection 是物体识别。object detection是基于slim模型分类后的目标识别。
research文件夹API如下：
adversarial_crypto：用对抗性神经密码术保护通信。
adversarial_text：带有对抗训练的半监督序列学习。
attention_ocr：用于实际图像文本提取的模型。
audioset：模型和与使用支持代码 AudioSet。
autoencoder：各种自动编码器。
brain_coder：强化学习的程序综合。
cognitive_mapping_and_planning：用于视觉导航的基于空间存储器的映射和规划架构的实现。
压缩：使用预先训练的残余GRU网络压缩和解压缩图像。
cvt_text：使用跨视图训练的半监督序列学习。
deep_contextual_bandits：使用深度神经网络和Thompson采样的各种上下文绑定算法的代码。
deep_speech：自动语音识别。
deeplab：语义图像分割的深度标注。
delf：用于图像匹配和检索的深层局部特征。
differential_privacy：训练数据的差异隐私。
domain_adaptation：域名分离网络。
fivo：过滤用于训练生成序列模型的变分目标。
gan：生成对抗网络。
im2txt：用于图像字幕的图像到文本神经网络。
开始：用于计算机视觉的深度卷积网络。
keypointnet：通过端到端几何eeasoning [ demo ] 发现潜在的3D关键点。
learning_to_remember_rare_events：用于深度学习的大型终身内存模块。
learning_unsupervised_learning：元学习无监督学习更新规则。
lexnet_nc：名词复合关系分类的分布式模型。
lfads：用于分析神经科学数据的顺序变分自动编码器。
lm_1b：十亿字基准的语言建模。
lm_commonsense：使用语言模型的常识推理。
maskgan：使用GAN生成文本。
namignizer：识别并生成名称。
neural_gpu：高度并行的神经计算机。
neural_programmer：用逻辑和数学运算增强的神经网络。
next_frame_prediction：通过交叉卷积网络的概率未来帧合成。
object_detection：在单个图像中本地化和识别多个对象。
pcl_rl：几种强化学习算法的代码，包括路径一致性学习。
ptn：用于3D对象重建的透视变换器网。
marco：自动化结晶实验的评估。
qa_kg：用于知识图上问答的模块网络。
real_nvp：使用实值非体积保持（真实NVP）变换的密度估计。
螺纹钢：离散潜变量模型的低方差，无偏梯度估计。
resnet：深度和广泛的剩余网络。
seq2species：读取级分类学分类的深度学习解决方案。
skip_thoughts：递归神经网络句子到矢量编码器。
slim：TF-Slim中的图像分类模型。
street：使用Deep RNN从图像中识别街道的名称（在法国）。
swivel：用于生成单词嵌入的Swivel算法。
syntaxnet：自然语言语法的神经模型。
tcn：从多视图视频学习的自我监督表示。
文本：用于文本摘要的注意模型的序列到序列。
变换器：空间变换器网络，它允许对网络内的数据进行空间操纵。
vid2depth：从单眼原始视频无监督的学习深度和自我运动。
video_prediction：用神经平流预测未来的视频帧。

我们可以删除其他API,只保留下object detection 以及slim

2.VOC2012数据集：

OC2012数据集分为20类，包括背景为21类，分别如下：

Person: person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下载完成后，可以看到文件夹如下：
在这里插入图片描述

在这里插入图片描述
其中在图像物体识别上着重需要了解的是Annotations、ImageSets和JPEGImages。
Annotations：所有图片的.xml文件
ImageSets：test.txt,val.txt,val.txt.train.txt等文件
JPEGImages：图片

地瓜埋地下

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用Tensorflow Object Detection 的目录及数据集分析

使用Tensorflow Object Detection 的目录及数据集分析一.源码框架简介：1.object detection进入github中可以看到实现的功能非常多：其中，official文件夹是官方例程API的集合，都已经经过了优化和稳定性测试。research文件夹是我们的重点，其中的object detection 是物体识别。object detection是基于slim模型分类后的目标识别。research文件夹API如下：adversarial_crypto：用对抗性神经
复制链接

扫一扫