- 博客(5)
- 收藏
- 关注
原创 场景文字检测
场景文字检测可以作为OCR的前端,为可以应用于商标识别等应用。https://blog.csdn.net/intflojx/article/details/812783931 赛题简介在互联网世界中,图片是传递信息的重要媒介。特别是电子商务,社交,搜索等领域,每天都有数以亿兆级别的图像在传播。图片文字识别(OCR)在商业领域有重要的应用价值,是数据信息化和线上线下打通的基础,也是学术界...
2018-07-30 15:36:36 6004 3
原创 商家招牌的分类与检测
现实生活中的招牌各种各样,千变万化。针对初赛,在现实世界中,选取100类常见的招牌信息,如肯德基、麦当劳、耐克等。将最终的分类结果上传到比赛平台。 数据典型图像 a.样本类别多样性 b.每类样本数据多样化思路:初赛难度不大,通过简单的数据增强,将图像经过ResNet50提取特征,经过FC+softmax或者SVM就能达到很好的...
2018-07-30 01:53:18 3443 8
原创 人脸比对(1:N)
第1章 前言设计出人脸1:N,随着N的增大准确率降低最小的解决方案具有很强的现实意义。人脸1:N的框架大致分为:人脸检测、人脸对齐、人脸映射与人脸识别LOSS的设计,结构如下图所示:图1:人脸1:N的主要框架人脸1:N在学术界有着广泛的研究,对于人脸检测与人脸对齐(MTCNN、TCDCN等)在业界已经有较好的效果,目前的主要性能提升有:DeepFace、DeepID,框架为CNN ...
2018-07-30 01:02:57 30141 17
原创 GAN网络清晰化游戏视频
一. 研究背景为了能够流畅运行游戏,我们除了在视频流上面进行编码,也可以通过压缩画面的大小,以1/4或者1/8的画质进行传输。在客户端使用超分辨率重建技术得到清晰化的画面。模型解释:从上到下分别为生成器和判别器,生成器通过Resnet Block块和Deconv(转置卷积)来获得对应的高分辨率图像。判别器通过输入清晰图像和生成图像,通过卷积层+Leaky ReLU+BN来提取图...
2018-07-30 00:48:02 1361 1
原创 轻量化网络mobileNet与ShuffleNet
摘要最近出了一篇旷视科技的孙剑团队出了一篇关于利用Channel Shuffle实现的卷积网络优化——ShuffleNet。我关注了一下,原理相当简单。它只是为了解决分组卷积时,不同feature maps分组之间的channels信息交互问题,而提出Channel Shuffle操作为不同分组提供channels信息的通信的渠道。然而,当我读到ShuffleNet Unit和Network ...
2018-07-26 16:12:34 6570 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人