【tensorflow2.0】图像定位

最新推荐文章于 2023-01-02 13:53:12 发布

糊涂懿

最新推荐文章于 2023-01-02 13:53:12 发布

阅读量569

点赞数

分类专栏： tensorflow2.0 文章标签： tensorflow

本文链接：https://blog.csdn.net/XXXXXXJY/article/details/109857769

版权

21 篇文章 1 订阅

订阅专栏

常见的图像处理的任务：

分类。给定一幅图像，用计算机模型预测图片中有什么对象。
分类+定位。不仅需要知道图片中的对象是什么，还要在对象的附近画一个边框，确定该对象所处的位置。
语义分割。对图像中的每一个像素点进行分类，而不仅仅是用矩形框框住。
目标检测。也就是回答图片里面有什么，分别在哪里。如Faster R-CNN、YOLO等。
实例分割。是目标检测和语义分割的结合，相对目标检测的边界框，实例分割可精确到物体的边缘；相对语义分割，实例分割需要标注出图上同一物体的不同个体。如Master R-CNN。

Oxford-IIIT数据集是一个宠物图像数据集，包含37种宠物，每种宠物200张左右图片，该数据集同时包含宠物分类、头部轮廓标注和语义分割信息。

预测图像位置本质上是一个回归问题，直接回归出位置，其缺点在于：

图像定位的优化思路有很多：

使用IoU（交并比， Intersection over Union）来评价图像定位的精度。IoU计算的是“预测的边框”和“真实的边框”的交集和并集的比值。

人体姿态估计（单人姿态估计）：
实际上就是人体关键点检测，预测出人体各个关节部位节点的位置。

关注