NLP领域的transformer模型竟然也可以使用到计算机视觉任务上？

最新推荐文章于 2024-05-29 14:23:25 发布

人工智能研究所

最新推荐文章于 2024-05-29 14:23:25 发布

阅读量76

点赞数 1

分类专栏：人工智能之计算机视觉人工智能之NLP自然语言处理文章标签：人工智能 transformer 计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44782294/article/details/131254455

版权

人工智能之计算机视觉同时被 2 个专栏收录

56 篇文章 1 订阅 ¥99.90 ¥99.00

订阅专栏

超级会员免费看

人工智能之NLP自然语言处理

37 篇文章 2 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

上期图文教程，我们分享了DETR模型，一个使用transformer模型的对象检测任务模型

此模型是Facebook发布的基于Transformer模型的端对端对象检测任务模型-- DETR（detect Transformer模型）。DETR模型首先使用CNN卷积神经网络搜集图片的核心特征点，然后把这些特征点整合起来，通过embedding方法，把特征图片转换到特征向量空间。然后根据标准Transformer模型的编码器与解码器进行注意力机制的计算，最后把计算后的数据进行图片对象的分类，并根据检测到的位置信息，提供对象box区域，方便我们画图。

上期教程，我们分享了如何使用TorchHub集成的DETR模型来进行对象检测任务，本期我们介绍一下如何使用hugging face集成的DETR模型进行对象检测任务。

了解本专栏

超级会员免费看

人工智能研究所

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
NLP领域的transformer模型竟然也可以使用到计算机视觉任务上？

hugging face的transformers模型集成了很多对象检测的模型，当然还有NLP领域的模型，本次使用的是DETR模型，由于transformers模型的高度集成，我们对DETR模型的代码并没有详细了解，下期我们会详细分享DETR模型的代码实现过程。上成为了可能，本期介绍的DETR模型就是基于transformer模型与CNN卷积神经网络的结合打造出的一个对象检测模型，从对象检测的结果来看，其使用transformer模型的对象检测方案，也能跟CNN卷积神经网络媲美。上期图文教程，我们分享了。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

人工智能研究所 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。