![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Harvester
文章平均质量分 94
门被核桃夹了还能补脑嘛
么的
展开
-
【OCR】文本检测方案 TextFuseNet解读
TextFuseNet: Scene Text Detection with Richer Fused Features🔗 PDF Link 🍺 Github Code一些总结,非作者文章内容:实质上是去通过文本检测中多级别的目标融合的方法来提升检测效果的,核心价值其实分两点来看提出了一种利用Mask-RCNN的流程以及多分枝的结构实现多层特征融合方案,从全局特征->词特征+字符特征来提升文字检测效果。性能优势非常非常明显,但是对应的推理速度相对较慢ResNet-50的backbone下原创 2022-02-25 14:42:10 · 2656 阅读 · 0 评论 -
PP-LCNet论文全文解析
PP-LCNet: A Lightweight CPU Convolutional Neural Network???? PDF Link ???? Github CodeSection 1 介绍随着模型参数和FLOPs的加大,模型越来越难以在基于ARM架构的移动端设备或者x86架构的CPU上取得较快的推理速度。虽然有许多优秀的移动端网络被设计出来,但是由于MKLDNN的限制,网络的推理加速效果并不理想。本文重新考虑了轻量级模型的构成,尤其是我们考虑了三个基础问题:在不增加网络延时的前提下,如原创 2021-10-22 17:21:47 · 3141 阅读 · 1 评论 -
RepVGG - 让VGG再次伟大!
RepVGG: Making VGG-style ConvNets Great Again???? PDF Link ???? Github CodeSection 1 介绍卷积网络最近成为了很多任务的主流解决方案。近期许多团队都开始专注更复杂、更精巧的网络结构设计如ResNet、DesNet等,甚至是使用NAS等自动结构搜索来进行网络设计。但是这类模型存在着一些缺陷:多分支的设计使得模型的实现落地和客制化变得困难,同时减慢了推理时间,并增加了内存占用。一些流行的操作虽然可以获得不错的准确率,原创 2021-01-16 18:57:04 · 1445 阅读 · 1 评论 -
【pSp】Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation【论文简单解读】
文章首发于jwxie.cnEncoding in Style: a StyleGAN Encoder for Image-to-Image Translation???? PDF Link ???? Github CodeSection 1 介绍近些日子,GAN在图像生成领域(尤其是人脸图像)取得了较大的进展。比如说StyleGAN就通过MLP实现了一个从离散的潜空间到人脸图像的可控、可编辑的人脸生成器。近些日子也又不少人尝试去进一步的探索了人脸编辑,但是很多情况下,我们需要把图像转换为潜空间里原创 2020-11-05 19:51:58 · 5291 阅读 · 1 评论 -
CVPR2020-人脸识别一些论文解读摘要
人脸识别方向一些论文快查Group FaceData Uncertainty Learning in Face RecognitionCurricularFaceGroup Face 【解决人脸识别backbone的问题】尽管损失函数得到了发展,但通用网络,不是为人脸识别而设计的网络,在有效训练网络以识别大量的人身份方面还存在困难。不像分类等常见问题,在评估阶段,人脸识别模型会遇到不包含在训练集的新身份。因此,该模型需要在训练集中嵌入近100k个身份,和考虑大量未知的身份。然而,现有的方法大多原创 2020-09-04 15:41:56 · 3320 阅读 · 6 评论 -
PPYOLO 简单的解读
首发于:jwxie.cnPP-YOLO: An Effective and Efficient Implementation of Object Detector???? PDF Link ???? Github CodeYOLO5还没来得及看,又来一个PPYOLO,有点多… ????Section 1 介绍开幕雷击,你们都是渣渣~随着深度学习的进步以及深度卷积网络的发展,对象检测(Object Detection)已经取得了比较大的进展,尤其是单阶段的OD。本文在YOLO3的基础上魔改,原创 2020-08-25 13:47:51 · 5160 阅读 · 8 评论 -
StyleGAN2 替换掉PULSE的欧洲脸和噪声
Analyzing and Improving the Image Quality of StyleGAN???? PDF Link ???? Github Code以为第一代就是巅峰了?Section 1 介绍StyleGAN在高分辨率图像的生成上有着巨大进步,但是依旧还存在着许许多多的小问题。首先第一个就是许多人发现的伪影,这里明确的分为两种不同的伪影。第一种是水滴状的伪影,第二种是由于Progressive growing所产生的。针对这两种伪影,文章分别在第二章和第四章进行了详细的描述。原创 2020-08-24 10:18:08 · 460 阅读 · 4 评论 -
ResNeSt 一个简单的解读
首发于:jwxie.cnResNeSt: Split-Attention Networks???? PDF Link ???? Github CodeAttention是个好东西。????Section 1 介绍分类网络结构是其他大多数任务的网络设计的基础。基于骨架网络,许多其他任务使用了如金字塔模块或者long-range连接,又或者是跨通道的特征图注意力机制来提升特定任务下的模型性能。这就引出了一个问题:能否可以创建一个全能的网络,提升特征提取过程的性能,从而实现对所有任务的优化。近期许原创 2020-08-21 09:49:07 · 1182 阅读 · 0 评论 -
YOLOv4 tricks的集合
首发于:jwxie.cnOptimal Speed and Accuracy of Object Detection???? PDF Link ???? Github CodeYou Only Look Once 系列续杯????Section 1 介绍主要贡献如下:发布了一个超高效但是强大的检测模型,使得所有人都可以使用1080Ti或者2080Ti训练模型。验证了BoF和BoS方法在训练时候的作用。修改了SOTA的方法,让CBM,PAN,SAM更高效,更适合单GPU训练。Secti原创 2020-08-21 09:48:11 · 272 阅读 · 0 评论