自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tabsong_coke的博客

喝着可乐,写着程序

  • 博客(8)
  • 收藏
  • 关注

原创 Faster RCNN 推理 从头写 java (七) 坐标转换为原始图片维度

一: 输入输出 输入: boxes_on_resize: 最终提取出来的bbox,是在VGG16 输入图片维度上的坐标 ratio: 原始图片与VGG16 输入图片的比例关系 输出: boxes_on_origin: 原图上的矩形框. 二: 流程 坐标除以ratio 三: code by code ratio是 resize 图片size / 原始图片size 将 VGG16 输入图...

2019-06-28 21:42:41 289

原创 Faster RCNN 推理 从头写 java (六) NMS (非最大值抑制)

一: 输入输出 输入: candidate_bboxes: shape 为 [M, 4] candidate_probs: shape 为 [M, ] 输出: bboxes_on_resize: VGG16图片输入维度下的bbox, shape为 [M, 4] N 表示未知 result_probs: 最终boxes的概率, shape为 [M, ] M 表示未知 二: 流程 计算每个b...

2019-06-28 21:41:26 1233

原创 Faster RCNN 推理 从头写 java (五) Classifier网络输出对 ROIs过滤与修正

一: 输入输出 输入: ROIs: RPN to ROI 流程的输出, shape 为 [300, 4] P_cls: Classifier网络的输出, shape为 [1, 32, 2] P_regr: Classifier网络的输出, shape为 [1, 32, 4] 输出: candidate_bboxes: 备选的boxes, shape为 [N, 4] N 表示未知 candid...

2019-06-28 21:39:04 402

原创 Faster RCNN 推理 从头写 java (四) Classifier 网络预测

一: 输入输出 输入: ROIs: RPN to ROI 后 没32个为一组的ROIs, shape为 [1, 32, 4] feature: RPN 层的输出, 也就是VGG16的feature map, shape 为 [1, 37, 50, 512] 输出: P_cls: 每个ROI的概率 shape为 [1, 32, 2] P_regr: 每个ROI的回归值, shape 为 [...

2019-06-28 21:36:54 295

原创 Faster RCNN 推理 从头写 java (三) RPN to ROIs

一: 输入输出 输入: cls: RPN网络的输出, shape为 [1, 37, 50, 49] reg: RPN网络的输出, shape为 [1, 37, 50, 196] 输出: R: ROIs, shape为 [300, 4] 二: 流程 遍历所有的anchor, 7个anchorSize, 7个anchorRatio, 共 49个anchor 计算每个anchor在每个feat...

2019-06-28 21:35:09 303

原创 Faster RCNN 推理 从头写 java (二) RPN网络预测

一: 输入输出 输入: omg: 经过预处理过的图像, shape为 [1, 600, 800, 3]. 输出: cls: 每个anchor在pixel上的概率, shape为 [1, 37, 50, 49]. reg: 每个anchor在pixel上的回归值, shape 为 [1, 37, 50, 196]. feature: 经过VGG16后的feature map, shape ...

2019-06-28 21:30:31 299

原创 Faster RCNN 推理 从头写 Java (一) 图片预处理

一: 输入输出 输入: 图像,shape为 [1080, 1440, 3] 输出: 图像,shape为 [1, 600, 800, 3] 二: 流程 图片BGR 格式转换为 RGB 格式。 图片缩放。 图片均值中值化。 三: code by code 使用opencv 读取图片格式为RGB, shape 为 (height = 1080, weight = 1440, channels = 3...

2019-06-28 21:26:07 901 1

原创 Faster RCNN 推理 从头写 java 整体流程

前言 项目中涉及大量的货车码表图片,目前需要运营同学人工提取出码表里程值,图片会随着项目的实施,会有大量的图片产生, 为了降本增效,需要我们从深度学习的角度来自动化的提取码表总里程值,该任务会分为三个流水线: 分类 (判断是否码表) 检测 (检测码表坐标) 识别(提取码表里程值) Faster RCNN 是该流水线第二步,检测的具体实现. 测试效果 输入图片 输出图片 输入: 图片size...

2019-06-28 21:20:54 523

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除