只星若晨-CSDN博客

原创 [1]DOLG: Single-Stage Image Retrieval with Deep Orthogonal Fusion of Local and Global Features

图像检索

2022-11-04 20:23:39 2750 5

原创 [1] A Keypoint-based Global Association Network for Lane Detection

车道线检测GANet

2022-06-23 10:25:13 1155

原创 [3] Cascade R-CNN: Delving into High Quality Object Detection【Object Detection番外】

Cascade R-CNN: Delving into High Quality Object Detection【Object Detection番外】3.1 摘要总结目标检测模型的典型问题，训练中使用小的IOU阈值会产生大量的噪声，使用大的IOU阈值则会导致模型性能大幅下降。两个原因：（1）指数级丢失正样本导致模型过拟合（大IOU阈值）（2）propose的IOU阈值与prediction detector的阈值不一致（搭配不一致，并不是值相等）导致性能下降对以上两点，知乎有作者给出了较为详细

2022-04-20 20:04:20 1339

原创 [2] Hybrid Task Cascade for Instance Segmentation(HTC)

Hybrid Task Cascade for Instance Segmentation(HTC)2.1 摘要基于Cascade R- CNN和Mask R-CNN，有效地利用检测和分割的互补性，提出HTC：（1）多阶段检测和分割协同学习；（2）采用提供空间上下文信息的全卷积分枝，用于在复杂背景下分辨前景2.2 介绍Cascade R-CNN优势：（1）预测渐近优化（2）自适应地处理训练分布。Cascade R-CNN与Mask R-CNN的简单结合不能在检测和分割两个任务带来均衡的性能提

2022-04-20 20:02:58 2604

原创 [1] Instances as Queries

Instances as Queries1.1 摘要基于Query，由动态掩膜head平行监督驱动的实力分割方法。关键点：object query跨阶段一一对应；object query与mask ROI feature同阶段一一对应。1.2 介绍目前SOTA实力分割方法主要基于高性能目标检测器，遵循多阶段设计方式。MASK R-CNN系列，ROI Pool、ROI Align、RPN、feature+FCN(mask)。DETR基于query的目标检测方法。因此，想到MASK R-CNN + Q

2022-04-20 20:01:29 3475

原创卷积神经网络与深度学习各个任务相关基础知识点杂谈

1. 正则化

2021-08-13 18:36:56 266

原创 OCR文本检测之Pixel-link

一、概述PixelLink，基于文本实例分割的文本检测算法。通过Pixel分割确定文本区域，同时根据Pixel Link condition对文本区域进行连接或者分离。文章根据这两方面设计网络损失函数。二、网络结构PixelLink的网络结构如下所示：图像输入到CNN（VGG16 backbone）进行特征提取，通过上采样+卷积恢复分辨率，输出18个通道特征图：12通道用于预测每个像素属于/不属于文本区域（概率值）；82通过用于预测每个像素与其8邻域（左、左上、上、右上、右、右下、下、左下）像素是

2021-08-05 16:00:04 989

原创 MODNet matting

一、要解决的问题无绿幕人像抠图I=α∗F+(1−α)∗BI=\alpha *F+(1-\alpha)*BI=α∗F+(1−α)∗B二、创新点无绿幕、无trimap人像端到端抠图SOC模型泛化迁移，OFD视频抠图增强Validation Benchmark三、具体细节MODNet网络结构如上图所示。主要包括三个自网络：Semantic Branch；Detail Branch；Fusion Branch。Sematic BranchEncoder-Decoder结构，采用Mobi

2021-07-21 16:55:11 919

原创 Background Matting-v2

一、要解决的问题抠图问题：I=α∗F+(1−α)∗BI=\alpha*F+(1-\alpha)*BI=α∗F+(1−α)∗B输出高质量alpha，保留发丝细节二、创新点两阶段抠图：base-matting与refine-matting，由粗到细base阶段预测额外预测Error Map，用于表征需要refine的区域两个数据集：图像数据集PhotoMatte85和视频数据集VideoMatte240K三、具体细节MattingBase网络：Base网络是基于Deeplabv3+修

2021-07-21 14:22:28 1930

原创 Background Matting-v1

sadfasfafas

2021-07-19 23:41:23 326

原创激活函数与损失函数及其常见问题

一、激活函数 Sigmoid、tanh、ReLU、LeakyReLU、PReLU、RReLU0.激活函数的作用神经网络为什么需要激活函数：首先数据的分布绝大多数是非线性的，而一般神经网络的计算是线性的，引入激活函数，是在神经网络中引入非线性，强化网络的学习能力。所以激活函数的最大特点就是非线性。不同的激活函数，根据其特点，应用也不同。Sigmoid和tanh的特点是将输出限制在(0,1)和(-1,1)之间，说明Sigmoid和tanh适合做概率值的处理，例如LSTM中的各种门；而ReLU就不行，因为

2021-07-16 18:47:52 1908

原创 DeepLab之语义分割损失函数和评价指标

一、损失函数1.交叉熵损失 Cross Entorpy Loss逐像素交叉熵损失是图像分割中最常用的损失函数。该损失函数分别检查每个像素，将类预测（softmax 或 sigmoid）与目标向量（one hot）进行比较。1.1交叉熵。关于样本集的两个概率分布p和q，设p为真实的分布，例如[1, 0, 0]表示当前文本属于第一类；q为拟合的分布，例如该文本的分布为[0.7, 0.2, 0.1]。按照真实分布p来衡量识别一个样本所需的编码长度的期望，即平均编码长度（信息熵）：H(p)=−∑i=1C

2021-07-16 14:42:57 2533

原创 DeepLab-v3+

一、待解决的问题网络连续下采样和重复池化，导致输入特征图分辨率较低空间不变性，丢失大量细节信息物体多尺度问题二、创新点引入编解码结构Encoder-Decoder，v3作为Encoder，添加Decoder作为输出处理过程，优化边缘引入Xception和Depthwise separable convolution，应用到ASPP和Deconder过程修改了Xception，使用strider=2的Depthwise separable convolution代替所有的Maxpoolin

2021-07-14 22:21:47 537

原创 DeepLab-v3

一、待解决的问题连续下采样和重复池化，导致最后特征图分辨率低图像中存在多尺度问题空间不变性导致细节信息丢失（v3未采用CRF）二、创新点增加多尺度分割物体的模块，设计了串行和并行的空洞卷积模块，采用不同的膨胀率atrous rate三、具体细节...

2021-07-14 16:05:00 855

原创 DeepLab-V2

一、待解决的问题连续下采样和重复池化，导致最后特征图分辨率低图像中存在多尺度的物体（v1没有针对性提出与解决，只是提到了网络特征的多尺度融合（跳层链接））空间不变性导致细节信息丢失二、创新点使用空洞卷积代替部分池化操作空洞卷积空间金字塔池化ASPP，融合多尺度信息得到更精确的分割结果组合DCNN和CRF，优化分割边界结果三、具体细节1.空洞卷积两种实现方式：上采样卷积核，参数之间插入（r-1）个0。尺寸为k的卷积核上采样之后大小为k+(k-1)*(r-1)下采样输入特征图

2021-07-14 15:29:06 271

原创 DeepLab-v1

一、待解决的问题重复池化和下采样导致分辨率大幅下降，位置信息丢失严重空间不变性导致细节信息丢失二、创新点DCNN结合CRF，提高分割图像的精度空洞卷积多尺度、多层次信息融合三、具体细节：1.空洞卷积空洞卷积，dilate rate，在同样卷积核大小的情况下，通过增加input stride来增加卷积核的感受野。空洞卷积参数的d，则（d-1）表示尺寸为k的卷积核每两个元素之间塞入的空格数），空洞卷积的卷积核大小为：k+(k−1)∗(d−1)k+(k-1)*(d-1)k+(k−1)

2021-07-14 11:04:20 302

原创 OpenVINO2020.4 人脸分析系列（一）：人脸检测C++ Demo

Opnvino2020.4版人脸检测OpenVINO2020.4版人脸检测Demo：提示：这里可以添加学习目标例如：一周掌握 Java 入门知识学习内容：提示：这里可以添加要学的内容例如：1、搭建 Java 开发环境2、掌握 Java 基本语法3、掌握条件语句4、掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：1、周一至周五晚上 7 点—晚上9点2、周六上午 9 点-上午 11 点3、周日下午 3 点-下午 6 点学习产出：提示：这里统计

2020-10-19 17:15:34 1126 4

原创 Esxi\CentOS7.6虚机\2080ti驱动 Unable to determine the device handle for GPU 0000:0B:00:00: Unknown ERROR

整体背景服务器使用Esxi虚拟出CentOS7.6的虚机，然后在虚机中给2080ti显卡安装驱动安装过程1.配置显卡直通此部分由运维完成，未参与其中，可参考攻略：https://blog.51cto.com/ganmu/19648232.更新基于长期维护的4.4版本linux内核（主流5.5也可）：（1）内核和依赖包下载地址：https://elrepo.org/linux/kerne...

2020-03-26 16:26:55 11902 11

原创 github 31.3K高分人脸识别项目face_recogition之windows配置过程（极简单）

简介近期在做人脸识别，发现github上有一个31.3K（截止到2020.01.19）的高分人脸识别项目：github地址：https://github.com/search?q=face+recognition“本项目的人脸识别是基于业内领先的C++开源库 dlib中的深度学习模型，用Labeled Faces in the Wild人脸数据集进行测试，有高达99.38%的准确率。但对小孩...

2020-01-19 09:04:54 872

原创安装Torchvision并import后，显示ImportError: cannot import name 'PILLOW_VERSION' from 'PIL'

安装Torchvision时，默认安装的pillow版本为7.0.0，此版本的pillow已经移除了’PILLOW_VERSION’改为安装6.1版本的pillow$pip3 install pillow==6.1

2020-01-15 17:33:56 2374

原创解决Windows10 ssh连接Linux服务器Unable to negotiate with xx.xx.xx.xx port xx: no matching key exchange meth

解决Windows10 ssh连接Linux服务器Unable to negotiate with xx.xx.xx.xx port xx: no matching key exchange method found. Their offer: diffie-hellman-group1-sha1问题Git安装Git for windows:https://gitforwindows.org/...

2018-12-11 12:22:14 31122

zxrc的博客