enable_nvtx_profile:在ORT使用NVTX profile。NVTX(NVIDIA® Tools Extension SDK)是一个提供事件注解,编码ranges和资源的c接口程序库
use_horovod:使用horovod。Horovod是Uber开源的基于Ring-AllReduce方法的深度学习分布式训练工具,以支持多种流行架构包括TensorFlow、Keras、PyTorch等
msvc_toolset:使用msvc工具集。msvc是微软的编译器vc
use_xcode:使用xcode。xcode是Mac OS上的集成开发工具(IDE)
use_jemalloc:使用jemalloc。JeMalloc 是一款内存分配器,与其它内存分配器相比,它最大的优势在于多线程情况下的高性能以及内存碎片的减少。
use_mimalloc:使用mimalloc。mimalloc是具有出色性能特征的通用内存分配器,用于Koka和Lean语言的运行时系统
use_openblas:使用openblas。BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(矩阵运算库),BLAS:标准实现(Fortran),CBLAS:C的BLAS标准实现,Atlas:一种优化实现,GotoBLAS:多线程性能良好的优化实现(已停止更新),OpenBLAS:目前性能最好的开源实现,基于GotoBLAS,MKL:Intel实现,在Intel处理器上性能最佳
use_dnnl:使用dnnl。Dnnl是Intel开发的高性能深度学习优化库,此前叫做MKL-DNN。
use_mklml:使用mklml。Mklml是MKL中面向机器学习的部分
use_featurizers:使用ML Featurizer。ML Featurizer是adobe开发的用于特征工程中从数据中快速提取补充特征的库
use_ngraph:使用ngraph。nGraph是intel开源的,面向各种设备和框架的深度神经网络模型编译器,减少将模型部署到各种设备训练和运行的工作量
use_openvino:使用openvino。OpenVINO是英特尔基于自身现有的硬件平台开发的一种可以加快高性能计算机视觉和深度学习视觉应用开发速度工具套件,支持各种英特尔平台的硬件加速器上进行深度学习,并且允许直接异构执行,拥有算法模型上线部署的各种能力
use_nnapi:使用nnapi。Android Neural Networks API (NNAPI) 是一个基于 Android 系统的用于可在移动设备上运行与机器学习相关的计算密集型操作的 C 语言 API,NNAPI 将为更高层次的可构建和训练神经网络的机器学习框架(如 TensorFLow Lite, Caffe2, 等等)提供底层支持。
use_openmp:使用openmp。