雪饼的博客

专注大数据、人工智能,先专注、再专业、后卓越

大话文本检测经典模型:EAST

自然场景的文本检测是当前深度学习的重要应用,在之前的文章中已经介绍了基于深度学习的文本检测模型CTPN、SegLink(见文章:大话文本检测经典模型CTPN、大话文本检测经典模型SegLink)。典型的文本检测模型一般是会分多个阶段(multi-stage)进行,在训练时需要把文本检测切割成多个阶...

2019-06-20 13:12:42

阅读数 19

评论数 0

大话文本检测经典模型:SegLink

在自然场景中,例如灯箱广告牌、产品包装盒、商标等,要检测出其中的文字会面临着各种复杂的情况,例如角度倾斜、变形等情况,这时就需要使用基于深度学习的方法进行文字检测。在之前的文章中,介绍了基于卷积神经网络和循环神经网络的CTPN文本检测方法(见文章:大话文本检测经典模型 CTPN),该方法能在自然场...

2019-06-20 13:11:35

阅读数 13

评论数 0

【AI实战】手把手教你实现文字识别模型(入门篇:验证码识别)

文字识别在现实生活中有着非常重要的应用,主要由文字检测、内容识别两个关键步骤组成,在本博客之前的文章中已介绍了文字检测、内容识别的经典模型原理(见文章:大话文本检测经典模型:CTPN,大话文本识别经典模型:CRNN),本文主要从实战的角度介绍如何实现文字识别模型。 在之前的文章中,已经介绍过了跟...

2019-06-16 22:15:23

阅读数 67

评论数 0

大话文本识别经典模型:CRNN

在前一篇文章中(详见本博客文章:大话文本检测经典模型 CTPN),介绍了文字识别在现实生活中的广泛应用,以及文字识别的简单流程: 其中“文本检测”、“文本识别”是其中两个关键环节,“文本检测”已经在前一篇文章中介绍了详细的介绍,本文主要介绍“文本识别”的经典模型CRNN及其原理。 在介...

2019-06-14 00:06:57

阅读数 23

评论数 0

大话文本检测经典模型:CTPN

文字识别是AI的一项重要应用,例如将包装盒上的文字识别出来、将产品说明书上的文字识别出来、将大街上广告牌的文字识别出来等等,在现实生活中能给我们带来很大的便利,有着非常广泛的应用。 一个简单的文字识别流程如下: Step 1.通过手机、摄像机等设备采集含有待识别字符的图像,作为输入; S...

2019-06-14 00:05:19

阅读数 18

评论数 0

【AI实战】快速掌握TensorFlow(四):损失函数

在前面的文章中,我们已经学习了TensorFlow激励函数的操作使用方法(见文章:快速掌握TensorFlow(三)),今天我们将继续学习TensorFlow。 本文主要是学习掌握TensorFlow的损失函数。 一、什么是损失函数 损失函数(loss function)是机器学习中非常重要...

2019-06-01 15:43:44

阅读数 28

评论数 0

【AI实战】快速掌握TensorFlow(三):激励函数

到现在我们已经了解了TensorFlow的特点和基本操作(见文章:快速掌握TensorFlow(一)),以及TensorFlow计算图、会话的操作(见文章:快速掌握TensorFlow(二)),接下来我们将继续学习掌握TensorFlow。 本文主要是学习掌握TensorFlow的激励函数。 ...

2019-06-01 15:42:31

阅读数 25

评论数 0

【AI实战】快速掌握TensorFlow(二):计算图、会话 原

在前面的文章中,我们已经完成了AI基础环境的搭建(见文章:Ubuntu + Anaconda + TensorFlow + GPU + PyCharm搭建AI基础环境),以及初步了解了TensorFlow的特点和基本操作(见文章:快速掌握TensorFlow(一)),接下来将继续学习掌握Tenso...

2019-06-01 15:39:07

阅读数 25

评论数 0

【AI实战】快速掌握Tensorflow(一):基本操作

Tensorflow是Google开源的深度学习框架,来自于Google Brain研究项目,在Google第一代分布式机器学习框架DistBelief的基础上发展起来。Tensorflow于2015年11月在GitHub上开源,在2016年4月补充了分布式版本,最新版本为1.10,2018年下半...

2019-05-30 00:14:54

阅读数 12

评论数 0

【AI实战】动手训练自己的目标检测模型(YOLO篇)

在前面的文章中,已经介绍了基于SSD使用自己的数据训练目标检测模型(见文章:手把手教你训练自己的目标检测模型),本文将基于另一个目标检测模型YOLO,介绍如何使用自己的数据进行训练。 YOLO(You only look once)是目前流行的目标检测模型之一,目前最新已经发展到V3版本了,在...

2019-05-30 00:12:16

阅读数 34

评论数 0

【AI实战】手把手教你训练自己的目标检测模型(SSD篇)

目标检测是AI的一项重要应用,通过目标检测模型能在图像中把人、动物、汽车、飞机等目标物体检测出来,甚至还能将物体的轮廓描绘出来,就像下面这张图,是不是很酷炫呢,嘿嘿 在动手训练自己的目标检测模型之前,建议先了解一下目标检测模型的原理(见文章:大话目标检测经典模型RCNN、Fast RCNN、Fa...

2019-05-27 21:12:08

阅读数 15

评论数 0

【AI实战】动手实现人脸识别程序

人脸识别在现实生活中有非常广泛的应用,例如iPhone X的识别人脸解锁屏幕、人脸识别考勤机、人脸识别开门禁、刷脸坐高铁,还有识别人脸虚拟化妆、美颜,甚至支付宝还推出了刷脸支付、建设银行还实现了刷脸取钱……,可见人脸识别的用处非常广。 既然人脸识别这么有用,那我们能否自己来实现一个人脸识别模型呢?...

2019-05-27 01:39:56

阅读数 13

评论数 0

【AI实战】训练第一个AI模型:MNIST手写数字识别模型

在上篇文章中,我们已经把AI的基础环境搭建好了(见文章:Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基础环境),接下来将基于tensorflow训练第一个AI模型:MNIST手写数字识别模型。 MNIST是一个经典的手写数字数据集,来自美国国家标准...

2019-05-18 10:35:14

阅读数 67

评论数 0

【AI实战】深度学习基础环境搭建(Ubuntu + anaconda + tensorflow + GPU + PyCharm)

为方便日常的深度学习模型开发与测试,本人在自己笔记本上搭建一个深度学习的基础环境,便于学习AI使用。本人使用的笔记本配置是CPU为8代i5,显卡为GTX1060,内存为8G,基本上可满足日常的AI研究与学习。下面将介绍基础环境的搭建配置过程: 1、安装Ubuntu 18.04 (1)安...

2019-05-16 21:45:02

阅读数 17

评论数 0

27种深度学习的主流神经网络

深度学习发展迅速,每天都会冒出不少新的神经网络架构,像卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等等。对于从事AI的专业人士而言,要全面追踪、了解这些新的架构非常费力。 ASIMOV Institute绘制当前所流行的27张神经网络节点图,方便查阅和收藏,如下: ...

2019-05-16 20:37:23

阅读数 33

评论数 0

【干货整理】CNN(卷积神经网络)进化史

卷积神经网络(CNN)近年来取得了长足的发展,是深度学习中的一颗耀眼明珠。CNN不仅能用来对图像进行分类,还在图像分割(目标检测)任务中有着广泛的应用。CNN已经成为了图像分类的黄金标准,一直在不断的发展和改进。 刘昕博士总结了CNN的演化历史,如下图所示: CNN的起点是神经认知机模型,此时...

2019-05-16 20:33:02

阅读数 18

评论数 0

大话目标检测经典模型:Mark R-CNN

在之前的文章中介绍了目标检测经典模型(R-CNN、Fast R-CNN、Faster R-CNN),目标检测一般是为了实现以下效果: 在R-CNN、Fast R-CNN、Faster R-CNN中,实现了对目标的识别和定位,如下图所示: 为了更加精确地识别目标,实现在像素级场景中识别不同目标,利用...

2018-04-28 21:09:24

阅读数 142

评论数 0

大话目标检测经典模型(RCNN、Fast RCNN、Faster RCNN)

目标检测是深度学习的一个重要应用,就是在图片中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤:1、分类,识别物体是什么 2、定位,找出物体在哪里 除了对单个物体进行检测,还要能支持对多个物体进行检测,如下图所示: 这个问题并不是那么容易解决,由于物体的尺寸变化范围很大、摆放角度多变...

2018-03-31 14:52:26

阅读数 2661

评论数 0

机器学习的五大流派

有道是“罗马不是一天建成的”,机器学习的发展也是历经了很长时间,在这过程中形成了五大流派,这五大流派各有各的特点。1、符号主义(Symbolists) 名称:符号主义(Symbolists)起源:逻辑学、哲学核心思想:认知即计算,通过对符号的演绎和逆演绎进行结果预测问题:知识结构代表算法:逆演绎算...

2018-03-24 20:52:49

阅读数 1517

评论数 0

大话CNN经典模型:GoogLeNet(从Inception v1到v4的演进)

—— 原文发布于本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),欢迎关注。2014年,GoogLeNet和VGG是当年ImageNet挑战赛(ILSVRC14)的双雄,GoogLeNet获得了第一名、VGG获得了第二名,这两类模型结构的共同特点是层次更深了。VGG继承了Le...

2018-03-17 14:28:51

阅读数 405

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭