先占坑。。。。
本文主要介绍如何利用tensorRT 的c++ api完整实现yolov5的实例分割部署,平时我的博文点赞很少,说实话,我本来真的不想继续写下去,觉得没意思。当然我这篇写下去,如果没人关注我就直接归到私密文章里面了,这就当作自己的私人笔记。文章主要包括:
(1)yolov5实例分割属于单输入,多输出,这就要确保tensorRT如何处理
(2)多输出的值的实际参数意义
(3)后处理解码检测和分割掩膜的具体操作
(4)矩阵相乘的cuda实现、普通的手动cpu矩阵相乘实现、opencv上的cpu矩阵相乘实现
并给出如何进行三者差异对比
(5)给出整体的解码思路(比如真实掩膜 = warpaffine_实际输入大小(mask_coef * mask_protos -》 letterbox图上大小))
(6)sigmoid函数的cuda实现(将网络输出转为概率表示)
未完待续。。。。
参考资料: