机器学习笔记:卷积神经网络(CNN)基础知识

一. ImageNet图像分类大赛(ILSVRC)

ImageNet是针对超过1500万个物品的高分辨率图像的数据集,大约有22,000个类别。图像是从网上收集的,并由人工使用Ama-s Mechanical Turk工具进行标记。2010-2017,作为Pascal视觉对象挑战赛的一部分,举办了名为ImageNet大规模视觉识别挑战赛(ILSVRC)的年度比赛。ILSVRC使用ImageNet的一个子集,在1000个类别中分别拥有大约1000个图像。总之,大约有120万个训练图像,50,000个验证图像和150,000个测试图像。
ILSVRC具体细节
Top-5错误率是指:对于一个物品,列出5个可能的分类结果,如果有一个是正确的即判定此次分类正确。
ImageNet图像分类大赛历年top-5错误率
2012年错误率突然大幅下降,正是因为此次的冠军正是使用了CNN这种结构,12年之前的大部分比赛模型使用的都是浅层模型。
传统的图像分类方法往往需要面临的一个问题就是特征提取,对于一种图像分类算法,不同的特征提取方法得到的分类准确度可能大相径庭,而CNN的便利之处就在于可以自动的提取图像的特征。

二. 卷积神经网络结构

一个经典的卷积神经网络结构主要分为五个部分,输入层,卷积层,下采样层,全连接层以及输出层。
在这里插入图片描述
输入层:通常作为CNN的第一层,为了方便卷积运算,输入一般是固定大小的图像。
卷积层:卷积层是CNN的特征提取层,主要对输入层的图像进行卷积运算,提取图像特征;卷积层由一个个的卷积核组成,一般来说特征提取的能力跟卷积核的数量成正比。
下采样层:下采样又叫做池化层,该层通过计算一个区域内像素的平均值,在尽量保护图像信息的前提下对数据进行降维,加快网络的训练速度。
全连接层:全连接层类似于感知机的隐含层部分,全连接层可以有多个,它的作用是整合之前各个部分提取的特征值。
输出层:输出层的节点数跟神经网络的具体应用有关。如果神经网络的任务是分类的话,那么输出层通常是一个分类器。比如softmax分类器,支持向量机等等。

三. 卷积神经网络举例:AlexNet

AlexNet是深度学习教父Hiton和他的学生一同设计的,该网络斩获了2012年ILSVRC的冠军,那篇经典的论文:《ImageNet Classification with Deep Convolutional Neural Networks》仅仅在百度学术上就被引用了2.6万多次。
AlexNet的结构如下,五层的卷积层和三层的全连接层,其中第一、第二、第五层之后跟有下采样层,其是针对1000类物品进行分类的。

在这里插入图片描述
利用MATLAB中的深度学习工具箱可以很方便的调用Alexnet,通常可以很方便的将其应用的自己的分类任务中进行迁移学习,在这里介绍下用Alexnet进行分类的代码。利用Alexnet进行分类的代码如下:

net = alexnet; %调用Alexnet
figure(1)
J = imread('banana1.jpg');%选择要分类的图像
imshow(J)
I = imresize(J,[227,227]); %将其设置为输入层的图像大小
Label = classify(net,I)    %判断图像种类
figure(2)
imshow(I)

原图
处理过后的输入图像
在这里插入图片描述
分类结果显示的是banana(emmm看来网络不能分辨香蕉和香蕉皮)。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
吴恩达的深度学习笔记翻译,里面的目录已经做好,可以直接作为书去打印,欢迎大家下载。课程概述 这些课程专为已有一定基础(基本的编程知识,熟悉Python、对机器学习有基本了解),想要尝试进入人工智能领域的计算机专业人士准备。介绍显示:“深度学习是科技业最热门的技能之一,本课程将帮你掌握深度学习。” 在这5堂课中,学生将可以学习到深度学习的基础,学会构建神经网络,并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。Deep Learning Specialization对卷积神经网络 (CNN)、递归神经网络 (RNN)、长短期记忆 (LSTM) 等深度学习常用的网络结构、工具和知识都有涉及。 课程中也会有很多实操项目,帮助学生更好地应用自己学到的深度学习技术,解决真实世界问题。这些项目将涵盖医疗、自动驾驶、和自然语言处理等时髦领域,以及音乐生成等等。Coursera上有一些特定方向和知识的资料,但一直没有比较全面、深入浅出的深度学习课程——《深度学习专业》的推出补上了这一空缺。 课程的语言是Python,使用的框架是Google开源的TensorFlow。最吸引人之处在于,课程导师就是吴恩达本人,两名助教均来自斯坦福计算机系。完成课程所需时间根据不同的学习进度,大约需要3-4个月左右。学生结课后,Coursera将授予他们Deep Learning Specialization结业证书。 “我们将帮助你掌握深度学习,理解如何应用深度学习,在人工智能业界开启你的职业生涯。”吴恩达在课程页面中提到。 本人黄海广博士,以前写过吴恩达老师的机器学习个人笔记。有朋友报名了课程,下载了这次课程的视频给大家分享。Coursera的字幕不全,同学们在学习上感觉非常不方便,因此我找志同道合的朋友翻译和整理字幕,中英文字幕来自于由我和曹骁威同学组织爱好者翻译,希望对大家有所帮助。(备注:自网易公开课翻译深度学习课程后,我们不再翻译)
Coursera深度学习教程中文笔记 课程概述 这些课程专为已有一定基础(基本的编程知识,熟悉Python、对机器学习有基本了解), 想要尝试进入人工智能领域的计算机专业人士准备。介绍显示:“深度学习是科技业最热门 的技能之一,本课程将帮你掌握深度学习。” 在这5堂课中,学生将可以学习到深度学习的基础,学会构建神经网络,并用在包括吴 恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。Deep Learning Specialization对卷积神经网络 (CNN)、递归神经网络 (RNN)、长短期记忆 (LSTM) 等深度学 习常用的网络结构、工具和知识都有涉及。 课程中也会有很多实操项目,帮助学生更好地应用自己学到的深度学习技术,解决真实 世界问题。这些项目将涵盖医疗、自动驾驶、和自然语言处理等时髦领域,以及音乐生成等 等。Coursera上有一些特定方向和知识的资料,但一直没有比较全面、深入浅出的深度学习 课程——《深度学习专业》的推出补上了这一空缺。 课程的语言是Python,使用的框架是Google开源的TensorFlow。最吸引人之处在于, 课程导师就是吴恩达本人,两名助教均来自斯坦福计算机系。完成课程所需时间根据不同的 学习进度,大约需要3-4个月左右。学生结课后,Coursera将授予他们Deep Learning Specialization结业证书。 “我们将帮助你掌握深度学习,理解如何应用深度学习,在人工智能业界开启你的职业 生涯。”吴恩达在课程页面中提到。 本人黄海广博士,以前写过吴恩达老师的机器学习个人笔记。有朋友报名了课程,下载 了这次课程的视频给大家分享。Coursera的字幕不全,同学们在学习上感觉非常不方便,因 此我找志同道合的朋友翻译和整理字幕,中英文字幕来自于由我和曹骁威同学组织爱好者翻 译,希望对大家有所帮助。(备注:自网易公开课翻译深度学习课程后,我们不再翻译) 目前我正在组织团队整理中文笔记,由热心的朋友无偿帮忙制作整理,并持续更新。我 们的团队的劳动致力于AI在国内的推广,不会损害Coursera以及吴恩达老师的商业利益。 本人水平有限,如有公式、算法错误,请及时指出,发邮件给我,也可以加我qq。 黄海广

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值