深度学习（一）Keras环境搭建与mnist

最新推荐文章于 2024-07-28 13:47:26 发布

MachinePlay

最新推荐文章于 2024-07-28 13:47:26 发布

阅读量1.3k

点赞数 2

分类专栏：深度学习概论

本文链接：https://blog.csdn.net/qq_36643282/article/details/105090066

版权

本文介绍了深度学习库Keras的特性，强调其易用性和灵活性，并详细阐述了在Ubuntu 18.04上配置Keras环境，包括安装TensorFlow、Keras和Jupyter Notebook。通过Keras解决MNIST手写数字识别问题，展示了数据预处理、网络模型定义、训练过程，以及过拟合的概念。

摘要由CSDN通过智能技术生成

本文代码仓库https://github.com/MachinePlay/Keras-toturial 包含.py 代码和Jupyter Notebook的.ipynb文件

Keras

Keras是一个高度封装的python深度学习库，以TensorFlow或Thano为后端
最近打算重新系统的学习深度学习，于是就从使用Keras开始从零撸神经网络
Keras 具有以下重要特性。

相同的代码可以在 CPU 或 GPU 上无缝切换运行。
具有用户友好的 API，便于快速开发深度学习模型的原型。
内置支持卷积网络(用于计算机视觉)、循环网络(用于序列处理)以及二者的任意
组合。
支持任意网络架构:多输入或多输出模型、层共享、模型共享等。这也就是说，Keras
能够构建任意深度学习模型，无论是生成式对抗网络还是神经图灵机。

Keras 已有 200 000 多个用户，既包括创业公司和大公司的学术研究人员和工程师，也包括研究生和业余爱好者。Google、Netflix、Uber、CERN、Yelp、Square 以及上百家创业公司都在用 Keras 解决各种各样的问题。Keras 还是机器学习竞赛网站 Kaggle 上的热门框架，最新的深度学习竞赛中，几乎所有的优胜者用的都是 Keras 模型

Keras、TensorFlow、Theano 和 CNTK

Keras 是一个模型级(model-level)的库，为开发深度学习模型提供了高层次的构建模块。它不处理张量操作、求微分等低层次的运算。相反，它依赖于一个专门的、高度优化的张量库来完成这些运算，这个张量库就是 Keras 的后端引擎(backend engine)。Keras 没有选择单个张量库并将 Keras 实现与这个库绑定，而是以模块化的方式处理这个问题

image.png

因此，几个不同的后端引擎都可以无缝嵌入到 Keras 中。目前，Keras 有三个后端实现:TensorFlow 后端、 Theano 后端和微软认知工具包(CNTK，Microsoft cognitive toolkit)后端。

配置要求

本文使用Ubuntu18.04 搭载Nvidia GTX 1080Ti显卡，windows+cpu也行。

在开始开发深度学习应用之前，你需要建立自己的深度学习工作站。虽然并非绝对必要，但强烈推荐你在现代 NVIDIA GPU 上运行深度学习实验。某些应用，特别是卷积神经网络的图像处理和循环神经网络的序列处理，在 CPU 上的速度非常之慢，即使是高速多核 CPU 也是如此。即使是可以在 CPU 上运行的深度学习应用，使用现代 GPU 通常也可以将速度提高 5 倍或 10 倍。如果你不想在计算机上安装 GPU，也可以考虑在 AWS EC2 GPU 实例或 Google 云平台上运行深度学习实验。但请注意，时间一长，云端 GPU 实例可能会变得非常昂贵。

无论在本地还是在云端运行，最好都使用 UNIX 工作站。虽然从技术上来说可以在 Windows 上使用 K e r a s ( K e r a s 的三个后端都支持 W i n d o w s )，但我们不建议这么做。