deepsort-detection（自学）

最新推荐文章于 2024-08-23 16:53:34 发布

around_01

最新推荐文章于 2024-08-23 16:53:34 发布

阅读量62

点赞数

文章标签： python deep learning

本文链接：https://blog.csdn.net/m0_62951309/article/details/133654826

版权

# vim: expandtab:ts=4:sw=4
import numpy as np


class Detection(object):


    def __init__(self, tlwh, confidence, feature):
        self.tlwh = np.asarray(tlwh, dtype=np.float)
        self.confidence = float(confidence)
        self.feature = np.asarray(feature, dtype=np.float32)

    def to_tlbr(self):
        """Convert bounding box to format `(min x, min y, max x, max y)`, i.e.,
        `(top left, bottom right)`.
        """
        ret = self.tlwh.copy()
        ret[2:] += ret[:2]
        return ret

    def to_xyah(self):
        """Convert bounding box to format `(center x, center y, aspect ratio,
        height)`, where the aspect ratio is `width / height`.
        """
        ret = self.tlwh.copy()
        ret[:2] += ret[2:] / 2
        ret[2] /= ret[3]
        return ret

Detection类用于表示图像中的一个目标检测结果，其中包含了目标的位置信息和特征。

__init__(self, tlwh, confidence, feature):
- tlwh: 表示目标边界框的位置信息，是一个包含四个元素的列表或数组，分别表示左上角坐标 (x, y) 和框的宽度和高度 (w, h)。
- confidence: 目标检测器对该边界框的置信度得分。
- feature: 通过重新识别（reid）得到的表示该目标的特征向量。
这个构造函数初始化了Detection对象的属性，将输入的边界框位置信息、置信度和特征向量存储为对象的属性。
to_tlbr(self): 这个方法将边界框坐标转换为格式 (min x, min y, max x, max y)，即左上角和右下角坐标。具体操作为将左上角坐标(tlwh[:2])保持不变，然后加上宽度和高度(tlwh[2:])得到右下角坐标。
to_xyah(self): 这个方法将边界框坐标转换为格式 (center x, center y, aspect ratio, height)，其中：
- center x: 边界框中心的 x 坐标，即 tlwh[0] + 0.5 * tlwh[2]。
- center y: 边界框中心的 y 坐标，即 tlwh[1] + 0.5 * tlwh[3]。
- aspect ratio: 边界框的宽高比，即 tlwh[2] / tlwh[3]。
- height: 边界框的高度，即 tlwh[3]。

这两个方法提供了不同的边界框坐标表示格式之间的转换。例如，to_tlbr()方法将左上角坐标和宽高转换为左上角和右下角坐标，而to_xyah()方法将左上角坐标和宽高转换为中心坐标、宽高比和高度。这种转换可以根据具体的应用场景选择合适的表示方式，方便不同算法之间的集成和交互。

在Python中，列表（或者NumPy数组）的索引操作可以用来获取或者修改列表中的元素。在这个方法中，ret 是一个包含四个元素的列表，表示一个边界框的位置信息：(x, y, w, h)，其中 x 是左上角的 x 坐标，y 是左上角的 y 坐标，w 是边界框的宽度，h 是边界框的高度。

ret[:2] 表示 ret 列表的前两个元素，即 (x, y)，这就是左上角的坐标。
ret[2:] 表示 ret 列表的后两个元素，即 (w, h)，这就是边界框的宽度和高度。

因此，ret[:2] 获取了左上角的坐标，而 ret[2:] 获取了宽度和高度。

在这段代码中，ret[:2] 和 ret[2:] 的操作主要用于计算边界框的中心坐标 (center x, center y) 和宽高比 width / height。通过对这些元素进行适当的数学运算，可以将边界框的表示从 (x, y, w, h) 转换为 (center x, center y, aspect ratio, height)。

ret = self.tlwh.copy(): 这行代码创建了tlwh的副本，确保在后续的计算中不会影响到原始的 tlwh 值。
ret[:2] += ret[2:] / 2: 这行代码计算了边界框的中心坐标。ret[2:] / 2 计算了边界框宽度的一半和高度的一半，然后加到左上角坐标上，得到了中心坐标 (center x, center y)。
ret[2] /= ret[3]: 这行代码计算了边界框的宽高比。它将 ret[2]（即宽度）除以 ret[3]（即高度），得到了宽高比 width / height。

around_01

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
deepsort-detection（自学）

方法将左上角坐标和宽高转换为中心坐标、宽高比和高度。这种转换可以根据具体的应用场景选择合适的表示方式，方便不同算法之间的集成和交互。计算了边界框宽度的一半和高度的一半，然后加到左上角坐标上，得到了中心坐标。对象的属性，将输入的边界框位置信息、置信度和特征向量存储为对象的属性。类用于表示图像中的一个目标检测结果，其中包含了目标的位置信息和特征。这两个方法提供了不同的边界框坐标表示格式之间的转换。方法将左上角坐标和宽高转换为左上角和右下角坐标，而。的副本，确保在后续的计算中不会影响到原始的。
复制链接

扫一扫