2018年07月_爱破破爱科研

12月 10月 09月 08月 07月

原创场景文字检测

场景文字检测可以作为OCR的前端，为可以应用于商标识别等应用。https://blog.csdn.net/intflojx/article/details/812783931 赛题简介在互联网世界中，图片是传递信息的重要媒介。特别是电子商务，社交，搜索等领域，每天都有数以亿兆级别的图像在传播。图片文字识别（OCR）在商业领域有重要的应用价值，是数据信息化和线上线下打通的基础，也是学术界...

2018-07-30 15:36:36 6004 3

原创商家招牌的分类与检测

现实生活中的招牌各种各样，千变万化。针对初赛，在现实世界中，选取100类常见的招牌信息，如肯德基、麦当劳、耐克等。将最终的分类结果上传到比赛平台。数据典型图像 a.样本类别多样性 b.每类样本数据多样化思路：初赛难度不大，通过简单的数据增强，将图像经过ResNet50提取特征，经过FC+softmax或者SVM就能达到很好的...

2018-07-30 01:53:18 3443 8

原创人脸比对（1:N）

第1章前言设计出人脸1：N，随着N的增大准确率降低最小的解决方案具有很强的现实意义。人脸1：N的框架大致分为：人脸检测、人脸对齐、人脸映射与人脸识别LOSS的设计，结构如下图所示：图1：人脸1：N的主要框架人脸1：N在学术界有着广泛的研究，对于人脸检测与人脸对齐（MTCNN、TCDCN等）在业界已经有较好的效果，目前的主要性能提升有：DeepFace、DeepID，框架为CNN ...

2018-07-30 01:02:57 30141 17

原创 GAN网络清晰化游戏视频

一. 研究背景为了能够流畅运行游戏，我们除了在视频流上面进行编码，也可以通过压缩画面的大小，以1/4或者1/8的画质进行传输。在客户端使用超分辨率重建技术得到清晰化的画面。模型解释：从上到下分别为生成器和判别器，生成器通过Resnet Block块和Deconv(转置卷积)来获得对应的高分辨率图像。判别器通过输入清晰图像和生成图像，通过卷积层+Leaky ReLU+BN来提取图...

2018-07-30 00:48:02 1361 1

摘要最近出了一篇旷视科技的孙剑团队出了一篇关于利用Channel Shuffle实现的卷积网络优化——ShuffleNet。我关注了一下，原理相当简单。它只是为了解决分组卷积时，不同feature maps分组之间的channels信息交互问题，而提出Channel Shuffle操作为不同分组提供channels信息的通信的渠道。然而，当我读到ShuffleNet Unit和Network ...

2018-07-26 16:12:34 6570 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 场景文字检测

原创 商家招牌的分类与检测

原创 人脸比对（1:N）

原创 GAN网络清晰化游戏视频

原创 轻量化网络mobileNet与ShuffleNet

空空如也

空空如也

原创场景文字检测

原创商家招牌的分类与检测

原创人脸比对（1:N）

原创轻量化网络mobileNet与ShuffleNet