实战需求
本文提供了一个简单的模型迁移样例,采用了最简单的自动迁移方法,帮助用户快速体验GPU模型脚本迁移到昇腾NPU上的流程,将在GPU上训练CNN模型识别手写数字的脚本代码进行修改,使其可以迁移到昇腾NPU上进行训练。
基础知识
昇腾(HUAWEI Ascend)310 是一款高能效、灵活可编程的人工智能处理器,在典型配置下,半精度(FP16)算力达到 16 TFLOPS,整数精度(INT8)算力达到 8 TOPS,功耗仅为 8W。采用自研华为达芬奇架构,集成丰富的计算单元,提高 AI 计算完备度和效率,进而扩展该芯片的适用性。全 AI 业务流程加速,大幅提高 AI 全系统的性能,有效降低部署成本。
昇腾(HUAWEI Ascend)910 是业界算力最强的 AI 处理器,基于自研华为达芬奇架构 3D Cube 技术,实现业界最佳 AI 性能与能效,架构灵活伸缩,支持云边端全栈全场景应用。算力方面,昇腾 910 完全达到设计规格,半精度(FP16)算力达到 320TFLOPS,
整数精度(INT8)算力达到 640 TOPS,功耗 310W。