tensorflow
文章平均质量分 95
Zhao Dongyu
技术共享,共同成长:)
展开
-
解决由于历史原因解析tflite失败的问题
最开始的时候,tflite 认为 `opcode` 不会超过 256 个,所以使用了 `u8` 来存储。后来就超过了 256 个,改成 `int` 来存储。但是又不能直接改,所以搞了个巧妙的方式:如果 `opcode` 小于 256,那么还是用 `u8` 来存,但是大于 256 的就必须走新的 `field` 了。原创 2024-03-19 10:39:37 · 1154 阅读 · 0 评论 -
【RUY】tensorflow int8量化推理代码学习
本来想学习gemm的相关代码,看一看tensorflow是怎么高效的进行int8推理,然后看到ruy更高效,于是研究了一会儿ruy。原创 2023-03-23 15:24:40 · 563 阅读 · 0 评论 -
tensorflow 模型浮点数计算量和参数量估计
文章目录写在前面的话计算量、参数量实验统计模型的内存、耗时情况写在前面的话之前在pytorch统计参数量和计算量用stat非常的方便,现在转到tensorflow后发现tensorflow的参数量和计算量的统计相对来说就没那么方便了。在网上也搜了一些相关教程,发现用profiler来进行统计是最方便的。本文参考了:tensorflow 模型浮点数计算量和参数量估计和TensorFlow程序分析(profile)实战,他们都整理的都非常好,我在这里重新整理一遍方便自己看。计算量、参数量实验stat原创 2020-09-16 10:05:13 · 4223 阅读 · 1 评论