Intel® AI Analytics Toolkit (AI Kit)工具的使用:Tensorflow的使用入门

背景

 英特尔®人工智能分析工具包(ai Kit)为数据科学家、人工智能开发人员和研究人员提供了熟悉的Python*工具和框架来加速基于英特尔架构的端到端数据科学和分析管道。这些组件是使用oneAPI库构建的,用于低级计算优化。该工具包最大限度地提高了从预处理到机器学习的性能,并提供了高效的互操作性模型的发展。你可以在Al Kit上找到更多信息。用户可以学习如何运行Al Kit中不同组件的样本与那些入门样本。

TensorFlow*是深度学习领域广泛使用的机器学习框架,要求高效的计算资源利用。为了充分利用英特尔架构并提取最大性能,TensorFlow*框架已使用英特尔®oneDNN原语进行了优化。本文演示了如何训练示例神经网络,并展示了英特尔优化的TensorFlow*如何默认启用英特尔®oneDNN调用。英特尔优化的TensorFlow*可作为英特尔®人工智能分析工具包(ai Kit)的一部分。这个示例代码展示了如何开始使用Intel®优化TensorFlow*。实现了一个具有一个卷积层和一个ReLU层的示例神经网络。您可以使用简单的Python代码构建和训练TensorFlow*神经网络。此外,通过控制内置环境变量,本文试图明确演示如何调用Intel @ oneDNN原语,并显示其在神经网络训练期间的性能。

步骤

1. 激活conda环境

默认情况下,ai工具包安装在intel/oneapi文件夹中,需要root权限来管理它。

conda activate tensorflow

2. 运行脚本

1. 切换到示例目录。2. 运行Python脚本。

python TensorFlow_HelloWorld.py

3. 在Intel®DevCloud上运行示例(可选)

1. 在Linux*系统上打开终端。2. 登录Intel®DevCloud。

ssh devcloud

3.切换到示例目录。4. 为适当的节点配置示例。您可以使用单行脚本指定节点。5. 运行所提供的脚本,其中包含运行此工作负载所需的所有指令。

./q ./run.sh

6. 检查输出。7. 断开与Int

el®DevCloud的连接。

exit

结果示例

1. 在初始运行时,您应该看到类似于以下的结果:

0 0.4147554
1 0.3561021
2 0.33979267
3 0.33283564
4 0.32920069
[CODE_SAMPLE_COMPLETED_SUCCESSFULLY]

2. 在命令行中将ONEDNN_VERBOSE导出为1。oneDNN运行时详细跟踪应该类似于以下内容:

export ONEDNN_VERBOSE=1
Windows: set ONEDNN_VERBOSE=1

3.再次运行样本。您应该看到类似以下的详细结果:

2022-04-24 16:56:02.497963: I tensorflow/core/platform/cpu_feature_guard.cc:151] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 AVX512F FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
onednn_verbose,info,oneDNN v2.5.0 (commit N/A)
onednn_verbose,info,cpu,runtime:OpenMP
onednn_verbose,info,cpu,isa:Intel AVX-512 with Intel DL Boost
onednn_verbose,info,gpu,runtime:none
onednn_verbose,info,prim_template:operation,engine,primitive,implementation,prop_kind,memory_descriptors,attributes,auxiliary,problem_desc,exec_time
onednn_verbose,exec,cpu,reorder,jit:uni,undef,src_f32::blocked:cdba:f dst_f32:p:blocked:Acdb16a:f,,,10x4x3x3,0.00195312
onednn_verbose,exec,cpu,convolution,brgconv:avx512_core,forward_training,src_f32::blocked:acdb:f wei_f32:p:blocked:Acdb16a:f bia_f32::blocked:a:f dst_f32::blocked:acdb:f,attr-post-ops:eltwise_relu ,alg:convolution_direct,mb,4.96411
onednn_verbose,exec,cpu,convolution,jit:avx512_common,backward_weights,src_f32::blocked:acdb:f wei_f32:p:blocked:Acdb16a:f bia_undef::undef::f dst_f32::blocked:acdb:f,,alg:convolution_direct,mb,0.567871
...

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python 是一种非常流行的编程语言,广泛用于开发人工智能(AI)应用。在 Python 中,有许多库和框架可以帮助你构建和部署 AI 模型。以下是一些常用的 Python 库和框架,可用于开发 AI: 1. TensorFlow:由 Google 开发的深度学习框架,用于构建和训练神经网络模型。它提供了强大的工具和资源,可以进行各种类型的 AI 任务,如图像识别、语音识别、自然语言***特点。它易于使用且灵活,适合实验性研究和原型开发。 3. Keras:基于 TensorFlow 或 Theano 的高级神经网络 API,提供了简单而强大的接口,使得构建和训练神经网络模型更加容易。 4. Scikit-learn:用于机器学习任务的常用库,提供了各种算法和工具,包括分类、回归、聚类等。 5. NLTK(Natural Language Toolkit):用于处理自然语言处理(NLP)任务的库,提供了各种文本处理和分析工具。 6. OpenCV:用于计算机视觉任务的开源计算机视觉库,提供了各种图像处理和分析功能。 7. Gensim:用于主题建模和文本相似度计算的库,常用于处理大规模文本数据。 8. SpaCy:用于高性能自然语言处理任务的库,提供了一套快速而准确的 NLP 工具。 这只是一小部分可用于 Python 的人工智能库和框架。Python 的强大生态系统使得开发和部署 AI 应用变得更加方便和高效。无论是深度学习、机器学习还是自然语言处理,Python 提供了丰富的资源和工具,使得开发者可以更轻松地构建复杂的人工智能应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值