Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

深度学习是人工智能发展最为迅速的领域之一,Google、Facebook、Microsoft 等巨头都围绕深度学习重点投资了一系列新兴项目,他们也一直在支持一些开源深度学习框架。目前研究人员使用的深度学习框架有 TensorFlow、Torch 、Caffe、Theano、Deeplearning4j 等,而 Deeplearning4j 是为数不多以 Java/JVM 为基础,能与 Apache Spark 无缝结合,支持 CPU/GPU 集群分布式计算的开源框架。本文就来为大家详细介绍一下深度学习框架 Deeplearning4j 的重要组件,不同环境下的操作用法及实例分享。

在近期 AI 研习社的线上分享会,来自苏宁易购搜索技术研发部的资深算法工程师万宫玺为大家介绍了 Deeplearning4 框架的构成、主要功能模块并结合实例讲述具体的使用方法。

万宫玺,苏州大学硕士,现就职于苏宁易购搜索技术研发部,从事自然语言处理、机器视觉等领域的应用开发工作。熟悉诸如 Deeplearning4j、Keras 等开源深度学习框架。

  以下为主要分享内容

分享主题为基于 Java 的开源深度学习框架 - Deeplearning4j 的介绍与实例分享。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

分享内容可概括以下四方面:

  • Deeplearning4j 生态圈主要功能模块的介绍

  • Deeplearning4j 单机 / 并行 / 分布式建模过程介绍

  • Deeplearning4j 对迁移学习、强化学习的支持

  • 基于 Fashion Mnist 数据集的图像分类应用的开发、部署、上线实例

0?wx_fmt=jpeg

第一部分内容具体为 DL4j 的开源库背景,目前的项目进展情况和背后的支撑团队。

0?wx_fmt=jpeg

第二部分为 DL4j 的生态圈,主要介绍生态圈中最重要的三个模块:DL4j 本身,它所依赖的张量预算库 ND4j、DL4j 当中做数据 ETL 的库 DataVec。

DL4j 本身,它定义并且实现了比较经典的神经网络结构,比如图片中比较常用的卷积神经网络。机器学习都需要依赖一个张量运算框架,对于 DL4j,他依赖的是 ND4j 这样一个框架,libnd4j 是 ND4j 调用的一个库。

0?wx_fmt=jpeg

Model Zoo 是官方给出的经典神经网络结构的实现。包括 AlexNet,GoogLenet ,DeepFace,YOLO 等。Modle Zoo 在 0.9.0 版本之前是作为一个独立的工程存在的,0.9.0 之后的版本作为 DL4j 本身的一个模块,已经嵌入进去。

DL4j 所依赖的张量运算库 ND4J,ND4j 可当作 JAVA 版的 Numpy。

0?wx_fmt=jpeg

ND4j 内存管理情况:

ND4j 利用了堆外内存和堆上内存两个部分的内存做相应的计算。当用 ND4j 去声明一个具体的张量时候,是在堆外内存存储张量对象,堆上内存只存储张量对象的引用。设计的原因主要是我们所依赖张量运算库,大部分的运算空间都是在堆外内存上,把数据放到堆外内存可提高运行效率。

0?wx_fmt=jpeg

需要注意的是,用 ND4j 做神经网络的训练时,堆外内存一定要调的非常大,因为大量的工作都是在堆外内存做相应的张量运算。堆外内存要远远大于堆上内存。

ND4j 具体例子,第一个是如何去创建一个张量,并且把这个张量在底层存储的顺序打印出来。

第二个是 hadmard 乘积实现。用直白的话解释就是,两个张量相应的位置去做乘积,把这个结果形成新的向量,作为下一部分利用的结果,这个操作在包括卷积上面都是比较常用的。

0?wx_fmt=jpeg

数据 ETL 库,称之为 DataVec, 它的主要功能就是把语音信号,图片文件,文本文档转化为张量形式,做数据 ETL.

0?wx_fmt=jpeg

总结 DataVec 库的作用:它可以将非结构化数据经过处理转化变成张量型数据,也支持结构化数据的读取。

第三个部分怎么建模。分三个场景,第一个是本地单机建模;第二个是有多个 CPU 或多个 GPU 卡情况下怎么做并行建模;第三个是怎么和 Spark 结合做分布式的 DL4j 模型的建模。

建模的四个步骤并不是固定的,可以根据实际情况做灵活的处理。大致思路首先是生成这样一个训练,测试,验证数据集。

0?wx_fmt=jpeg

本地单机建模,首先是加载数据(包括本地数据和测试数据),其次是配置模型结构以及超参数,并初始化模型参数。最后,训练神经网络模型,并利用测试数据集进行评估。

0?wx_fmt=jpeg

数据并行化:

0?wx_fmt=jpeg

并行建模如图所示:

0?wx_fmt=jpeg

怎么和 Spark 结合做一个分布式的 Dp4j 模型的建模:

0?wx_fmt=jpeg

想要在 Spark 上面开发的同学,需要注意 Spark 的版本,因为 DL4j 支持 1.5、1.6 还有 2.0 之后的版本。框架接近 1.0 版本的发布,真正原生态支持 Spark 并不多,DL4j 和 Spark 的结合是它的一大亮点。

第四部分是强化学习模块,称之为 RL4j ,也是生态系统当中的一个组件。

迁移学习和强化学习在 DL4j 的支持情况:

0?wx_fmt=jpeg

0?wx_fmt=jpeg

具体应用实例分享:

0?wx_fmt=jpeg

0?wx_fmt=jpeg

  关于 Deeplearning4j 的总结

0?wx_fmt=jpeg

  个人在做 AI 方面的心得体会

  • 机器学习是 AI 的主要解决方案,但不是唯一方案。

  • 深度学习并不是万能的,对于非结构化数据:图像、文本、语音会有出色的效果,但传统机器学习模型同样很重要。

  • 数据的质和量在实际的应用中共同决定了模型的泛化能力。

  • 转型 AI 同样可以从 Hello World 入手。

  • 提升 AI 内功必须精通原理,而不仅仅跑出 Demo。

  • 不要局限于某一特定工具框架,可以取长补短。

  • 迁移学习和强化学习可能代表 AI 的未来。

如果想详细了解深度学习的应用,如何做开发,怎么去训练他的模型,怎么去调优,怎么去部署上线点击阅读原文,直达视频回放页面。

easyAi是一个用java进行开发的傻瓜ai框架,无需任何算法知识,通过简单的api调用就可以实现常用的图像内物体的识别,定位等图像ai服务,及自然语言分类处理服务。面向java开发程序员,不依赖任何第三方库,第三方接口,独立包。直接引入maven项目pom文件,就可以执行人工智能任务。easyAi说明本包原名imageMarket,因为开始加入自然语言模块,所以之后更名为easyAi。 本包对物体在图像中进行训练及识别,切割,定位的轻量级,面向小白的框架,功能在逐渐扩展中。 本包对中文输入语句,对输入语句的类别进行分类,功能在逐渐扩展中。easyAi软件目的 低硬件成本,CPU可快速学习运行,面向Java开发的程序员,经过简单API调用就可实现物体在图像中的识别、定位及中文语言分类等功能; 努力为中小企业提供AI场景解决技术方案,AI内核驱动力!为什么做easyAi这个包1、低门槛化:现在随着人工智能技术的兴起,很多场景需要开发人员添加相应的功能,但是在二三线城市算法人才匮乏,并且大多是Java开发程序员,业务做的更多,因为作者本人就是三线城市程序员,所以深知这一点。所以需要一款部署简单,不需要学习任何算法知识,只通过最简单的API调用,就可以实现部分人工智能应用,并面向覆盖面最广的Java程序员使用的,且能满足大部分AI业务场景实现的技术包。 2、面向用户:广大没接触过算法知识,人才相对匮乏的二三线Java业务开发程序员,实现人工智能应用。 3、部署简单:本包所有底层函数及数学库都是作者Java手写,不依赖任何第三方库,所以开发者只需要将本包下载到本地后,打成JAR包,引入到自己的POM文件中,就可以独立使用所有功能。 4、功能还在扩展:本包现在的功能还在逐步扩展中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值