![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法工程
文章平均质量分 90
sunny0660
CV/DL算法工程师
展开
-
Goolge-TPU论文解读
Google TPU介绍原创 2022-07-17 17:46:12 · 1199 阅读 · 1 评论 -
Transformer离线部署-GPU优化策略
前言模型结构分析具体优化措施参考资料原文:Transformer离线部署-GPU优化策略前言本文主要介绍Transformer类网络在GPU设备上部署上的优化要点。 主要围绕Nvidia开源的FasterTransformer展开。模型结构分析标准的Transformer结构主要包括 Encoder 和 Decoder 两部分结构,具体结构分析可参考Transformer在CV领域的应用与部署:Encoder对应算子结构为:Decoder对应算子结构为:可以发现:Encod.原创 2022-05-14 17:43:27 · 1259 阅读 · 0 评论 -
2D_Detection-通用检测Tricks
前言详细介绍样本不均衡常见Hard Example策略Focal Loss及其变种小物体检测如何融合多尺度特征脱离bbox看待问题检测密集遮挡场景nms引发的问题如何让定框变得准确?怎么解决高度重叠的场景?更多内容可访问个人博客:2D_detection检测综述前言通常来说,单一检测模型往往无法覆盖所有的场景;对于不同场景采用的不同的检测框架/训练数据/训练策略也是非常重要的。本文笔者简单归纳了几种常见的检测场景,并介绍该场景下一些通用的检测Trick.原创 2021-10-03 15:45:40 · 242 阅读 · 0 评论 -
ONNX的模型优化与量化细节
layout: posttitle: ONNX的模型优化与量化细节date: 2021-09-21 18:18:48.000000000 +09:00categories: [算法框架]tags: [离线推理]ONNX的模型优化与量化细节ONNX基本介绍什么是ONNX?ONNX全称为 Open Neural Network Exchange,是一种与框架无关的模型表达式。ONNX的规范及代码主要由微软,亚马逊 ,Facebook 和 IBM 等公司共同开发,以开放源代码的方式托管在G.原创 2021-09-21 21:53:44 · 4905 阅读 · 2 评论