深度学习
文章平均质量分 92
shenhuaifeng
计算机视觉、人工智能研究员
展开
-
三角测量(sfm 双视图重建)
1.极限约束与本征矩阵设世界坐标系中有一点ppp ,坐标为 XXX,它在左相机的图像坐标系为x1′x'_1x1′像素坐标系为x1x_1x1,在右相机中的图像坐标系为 x1′x'_1x1′则x=Kx′x=Kx'x=Kx′其中KKK为相机的内参矩阵,如图1(图中的x1x_1x1图像坐标系下的坐标,和公式的不同)设 ppp到两个相机光心垂直距离分别为 s1s_1s1和s2s_2s2,且两个相机有相同的内参矩阵KKK ,世界坐标系到两个相机坐标系的变换关系为 [R1,T1][R_1,T_1][R1.原创 2022-03-12 11:18:18 · 4413 阅读 · 1 评论 -
超越BN层的归一化方法FRN
BN层作为深度神经网络的必选组件在各种网络结构中得到了广泛的应用。然而训练输入的batchsize过小时,尤其是没有足够计算资源可用,不得不使用小batchsize来训练模型时,你会发现使用同样的方法和训练策略和别人有足够计算资源训练出来模型的表现差的不是一点半点。这一点我在自己设计(抄别人的网络。。。使用别人的训练策略)网络结构跑实验的时候也有发现在batch较小(显存不够办法呀。。。。)的情况...原创 2020-02-24 20:12:55 · 1437 阅读 · 1 评论 -
Mask R-CNN 关键点检测
Mask R-CNN阅读笔记摘要: 应用maskrcnn参加的阿里举办的一个比赛,效果还可以,不过有人做的更好,工程链接:https://github.com/huaifeng1993/FashionAI_Key_Points_Detection1.Intrduction物体检测和语义分割(semantic segmentation)发展很快,像用于物体检测的Fast/Faster R...原创 2018-05-18 18:47:43 · 23284 阅读 · 16 评论 -
deepLabV3+ 阅读笔记
Encoder-Decoder with Atrous Separable Convolution for Semantic Image SegmentationAbstract: 结合spp模块和encode-decode结构的优点提出的新的语义分割结构deepLabV3+。除此之外,作者还对ASPP模块和decode模块应用了Xception结构和分离卷积,应用这两个结构后的整个模型变得f...原创 2019-01-27 21:10:12 · 6313 阅读 · 0 评论 -
Xception 阅读笔记
Inception 假设常规卷积层试图在维度为长,宽,和通道数的3D的空间中学习一个滤波器,因此单个卷积核的任务是同时映射跨通道间相关性和空间空间相关性。Inception 模块背后的思想便是通过一系列明确的步骤把跨通道相关性和空间相关性独立开来映射。具体来说,Inception模块首先通过1x1卷积查看跨通道相关性,将其输入的数据映射到3-4个独立的子空间,然后使用不同大小的卷积核映射这些3D...原创 2019-02-08 10:44:32 · 1081 阅读 · 0 评论 -
deeplabv3:Rethinking Atrous Convolution for Semantic Image Segmentation 阅读笔记
在语义分割任务应用深度卷积神经网络有两个挑战:一个问题是深度网络中的pooling层的使用使得特征分辨率越来越小,网络学习的特征更加抽象化,这不利于期望局部空间细节信息的密集型任务例如图像分割。因此作者建议应用空洞卷积来应对这个问题。另一个问题是物体的多尺度。解决这个问题主要分为4类,第一类将深度网络应用于图像金字塔,以提取物体在不同尺度下的特征。第二类应用encode-decode结构,利...原创 2019-02-09 10:40:27 · 368 阅读 · 0 评论 -
tensorrt+tensorflow+object_detection编译安装填坑教程!!
tensorflow+tensorrt+object_detection (CUDA10.0 Cudnn7.4.1) 在anconda 环境下编译安装安装环境os: ubuntu 16.04cuda:10.0cudnn:7.4.1(其它版本也可以,eg:7.3.1)tensorflow:1.13.0rc(1.13.1版本容易编译失败)python:3.5 (3.7版本编译1.13.0...原创 2019-07-23 10:09:28 · 3198 阅读 · 2 评论