onnx支持很多细粒度算子,可以进行算子融合,但是融合后的粗粒度算子需要cuda那边的支持(可以自己去写cuda实现); 同时粗粒度算子可以很好地解决分支问题,详见https://zhuanlan.zhihu.com/p/272767300