深度学习框架的流行(如 PyTorch,Tensorflow 等)极大方便了我们研发设计各种各样的 AI 模型,而在实际落地的环节中,孵化于实验室里的模型代码往往在生产环境上面临着性能、准确度、资源等各种各样的问题。随着 AI 与现实世界的业务结合愈加密切,高性能且易使用的深度学习算子愈发受到 AI 研究者和开发者们的青睐。
幻方 AI 依托萤火二号平台,自研了一系列 AI 基础设施:3FS,hfreduce,ffrecord等。如之前系列文章中介绍的,他们极大地提升了模型训练中数据读取的性能,充分利用 GPU 算力。而对于计算环节,幻方 AI 同样对 Pytorch 框架进行了深度优化,结合「萤火二号」的集群特点,对一些常用的 AI 算子重新研发,提升效率,进一步提升了模型整体的训练效率。
本期文章将为大家介绍,幻方 AI 的深度学习算子 hfai.nn。
hfai.nn.parallel
在之前的文章