机器学习
C-------罗
985高校研究生毕业,模式识别专业,从事图像处理行业7年。现于上海腾讯科技工作
展开
-
OCR识别的开源分析
OCR识别的开源分析OCR软件主要是由下面几个部分组成。 1. 图像输入、预处理: 2. 图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。预处理:主要包括二值化,噪声去除,倾斜较正等 3. 二值化: 对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进原创 2016-06-08 16:36:45 · 17142 阅读 · 1 评论 -
Prisma 算法实现
**Prisma 算法实现**最近有一款流行的APP, 叫(Prisma),用户选择一张需要处理的图片,再选择一张艺术风格照, 就可以在线生成一张美图啦! 效果如下: 该功能的实现算法:斯坦福大学李飞飞组,基于感知损失函数的图像实时分割转换和超分辨率重建:Perceptual Losses for Real-Time Style Transfer and Super-Resolution Pap原创 2016-07-20 16:59:39 · 3202 阅读 · 1 评论 -
深度学习 VGG 网络 实现 face landmark 与 head pose
深度学习实现 人脸特征点(68点)标注及人脸3D姿态估计原创 2016-08-09 14:26:08 · 5778 阅读 · 16 评论 -
神经网络之激活函数(Activation Function)(附maxout)
神经网络之激活函数(Activation Function)(附maxout)转载 2017-04-25 11:18:01 · 1464 阅读 · 0 评论 -
SoftmaxWithLossLayer 详细讲解
SoftmaxWithLossLayer 原理分析及caffe代码实现原创 2017-11-02 20:09:44 · 695 阅读 · 1 评论 -
GANerated Hands for Real-Time 3D Hand Tracking from Monocular RGB
GANerated Hands for Real-Time 3D Hand Tracking from Monocular RGB(适用于单目RGB的实时三维手部跟踪)Franziska Mueller1,2 Florian Bernard1,2 Oleksandr Sotnychenko1,2 Dushyant Mehta1,2Srinath Sridhar3 Dan Casa...原创 2018-07-11 18:11:04 · 3153 阅读 · 3 评论 -
【论文分析笔记】 GoogLeNet --- Going deeper with convolutions
Going deeper with convolutions 目录1. 摘要2. 引言3. 相关工作4. 动机与高层次考虑5. 框架细节6. GoogLeNet 学习总结:卷积神经网络的问题有哪些? 通常神经网络要效果好,最简单的做法是加深网络层或者加宽网络层。这种做法简单暴力,易于实现。但是该方法存在以下几个缺点:a. 较大模型意...原创 2018-07-24 15:29:23 · 511 阅读 · 0 评论