全球首个开源图像识别系统上线了！人脸、商品、车辆识别一网打尽！

最新推荐文章于 2024-04-12 21:29:36 发布

OpenCV中文网公众号

最新推荐文章于 2024-04-12 21:29:36 发布

阅读量377

点赞数

文章标签：图像识别计算机视觉机器学习人工智能人脸识别

原文链接：https://mp.weixin.qq.com/s?__biz=MzUzODkxNzQzMw==&mid=2247492570&idx=1&sn=0ccbc05fafdf07c12121afcabc03d2b3&chksm=fad2cc8ccda5459af8f6be43b5c7b695ccc92717b6d116a7c87367fa18985b3e21b4cc047abc&scene=126&&sessionid=0

版权

关注公众号，发现CV技术之美

父老乡亲们！你知道人脸、商品、车辆识别，以图搜图乃至自动驾驶，背后的技术是什么嘛？

起初小编觉得不就是图像分类、目标检测这些东西嘛，有什么难的？但能熟练这些应用的BAT高级工程师们都轻松年薪百万，笑傲人生了！！！

当小编正在酸成柠檬精的时候，BAT大神幽幽的说：这背后是综合使用目标检测、图像分类、度量学习、图像检索的【通用图像识别系统】…

度量学习是啥？图像检索是啥？通用图像识别系统又是啥？！看来还是我Too Simple，Too Naive了…

难道我真的就无缘年薪百万了嘛？！正在小编捶胸顿足的时候，小编突然发现了一个通用图像识别系统快速搭建神器— PP-ShiTu！OMG！这不梦想一下就要实现了嘛！

赶紧Star收藏：

https://github.com/PaddlePaddle/PaddleClas

那这个项目到底有什么过人之处，图像识别又比图像分类、目标检测强在哪里呢？

拿[商品识别]举个栗子，如果你用单纯的图像分类和目标检测，你会发现：

商品类别数以万计：根本没法事先把所有类别都放入训练集！训练集都不完备怎么训练算法？

样本差别极小，区分难度极大：细分类差别极其细微，实际图像的拍摄角度也多变刁钻，识别准确率非常非常低。

产业上线速度要求极高：每张复杂的图片处理速度要求在毫秒级别，在闸机前让你等个3秒绝对要炸锅！

而这个PP-ShiTu图像识别系统就可以完美解决以上问题！

准备好需要识别的物体图片后，只需三步，多类别、微差异、高速度等问题通通不再是问题，绝对的 “开箱即用”，而且它不仅可以用作商品识别，还可以进行车辆、人脸、Logo、行人识别！！！

第一步通过目标检测模型，进行主体检测；
第二步对每个候选区域进行特征提取；
第三步将特征提取后的向量在检索库中进行检索，完成匹配，返回识别结果。

PP-ShiTu使用流程示例

而这个图像识别系统的4个核心构成模块，都是经过精心打磨。无论是单独使用亦或是串联开发，都有非凡的效果：

PP-ShiTu架构图

主体检测：采用高精度超轻量的PP-PicoDet检测算法，它的出现，使PP-ShiTu的主体检测模块预测速度提升了15倍以上，而精度几乎不衰减。

骨干网络：采用CPU级超高性价比的轻量化骨干网络PP-LCNet，它的准确率不仅超越大模型ResNet50的模型效果，预测速度还是后者的3倍！简直香个跟头！而PP-ShiTu充分挖掘该网络的潜力，学习一个具有超强泛化能力的特征提取模型，同一模型可在多个数据集上同时实现高精度识别。

度量学习：集成ArcMargin度量学习方法，轻松将图像转换成特征向量，训练出鲁棒的图像特征，以供后续进行检索识别。

检索系统：集成Faiss算法，高效完成向量检索。当增加新的品类时，不需要重新训练提取特征模型，仅需要更新检索库即可识别新的目标，一次训练长期使用，还兼容(Linux, Windows, MacOS)多平台。

开发者不仅可以单独或自主组装使用这四个模块，还可以直接采用构建好的车辆识别、LOGO识别、商品识别、动漫识别四个系统。只需要补充好检索库，就可以直接投产使用了！

有了它们的助力，看齐大厂程序员，年薪百万不是梦！（逐渐露出暴富的笑容~ ）

这么强大、用心的项目，你还在等什么？！还不赶紧Star🌟收藏上车吧！

传送门：
https://github.com/PaddlePaddle/PaddleClas

快速体验：

https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/quick_start/quick_start_recognition.md

直播预告

为了让开发者更深入的了解PaddleClas并手把手教大家完成图像识别系统的搭建，项目团队还精心准备了为期4天的直播课程。

11月2日-4日百度高工为我们讲解了图像识别技术难点和选型策略、SOTA模型炼丹秘诀以及图像识别产业应用落地方案，11月5日还有智能零售下的应用案例分享，现场直接为大家解答实际产业落地中的问题，还在等什么！赶紧扫码上车吧！

（错过直播的同学们不用担心，现在报名即可获取直播回放）

扫码报名直播课，加入技术交流群

精彩内容抢先看！长按收藏海报～

如果您想详细了解更多飞桨的相关内容，请参阅以下文档。

官网地址：

https://www.paddlepaddle.org.cn

【PaddleClas】项目地址：

GitHub: https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3

Gitee:
https://gitee.com/paddlepaddle/PaddleClas

这么强大、用心的项目，还不赶紧给各位开发者一个Star🌟的鼓励！

https://github.com/PaddlePaddle/PaddleClas

数据来源：部分图片来源于网络，侵权可删

OpenCV中文网公众号

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
全球首个开源图像识别系统上线了！人脸、商品、车辆识别一网打尽！

关注公众号，发现CV技术之美父老乡亲们！你知道人脸、商品、车辆识别，以图搜图乃至自动驾驶，背后的技术是什么嘛？起初小编觉得不就是图像分类、目标检测这些东西嘛，有什么难的？但能熟练这些应用的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。