支持对常用数据集的下载,对数据集处理,并转换为模型需要的格式。
支持多队列分批读取数据,因为绝大多数训练集都是海量的数据。
支持日志,有方便的调试工具链。
训练可以随时中断,重新运行可以从之前中断的训练中恢复,继续训练
详细的模型的图,多维度的详细的统计信息方便找到模型瓶颈。
模型支持多种异构设备(GPU,CPU,ASIC,移动设备)部署运行
支持分布式,并且具备分布式的高可靠,高可用。
支持 Fine-tune,即基于已训练的模型,进一步训练,并且可以从任意层开始训练(灵活的参数固定)。
后面,我将基于以上功能点,一一阐述如果构建一个产品级的 Tensorflow 程序。