LightWeight-Openpose保存输出的视频

最新推荐文章于 2024-05-30 09:55:47 发布

努力的BigJiang

最新推荐文章于 2024-05-30 09:55:47 发布

阅读量352

点赞数 4

文章标签：音视频 python opencv

本文链接：https://blog.csdn.net/m0_62948300/article/details/129917968

版权

我是个小垃圾，研究了两天才研究出来怎么保存视频呜呜呜呜。记录一下我踩的坑。

踩坑1：cv2.VideoWriter函数里的宽和高的参数要和输入视频保持一致

踩坑2：out.release写错位置，导致视频只有0秒，呜呜呜，小垃圾

下面附上轻量级Openpose保存输出的视频完整代码：

def run_demo(net, image_provider, height_size, cpu, track, smooth):
    net = net.eval()
    if not cpu:
        net = net.cuda()

    stride = 8
    upsample_ratio = 4
    num_keypoints = Pose.num_kpts
    previous_poses = []
    delay = 1
    cap=cv2.VideoCapture('自己的视频路径')
#保存视频，读取输入视频宽高和fps
    fourcc=cv2.VideoWriter_fourcc(*'XVID')
    width=int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    height=int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps=int(cap.get(cv2.CAP_PROP_FPS))
    print("width:",width,"height:",height,"fps:",fps)
    out=cv2.VideoWriter('output.avi',fourcc,fps,(width,height))
   
 for img in image_provider:
        orig_img = img.copy()
        heatmaps, pafs, scale, pad = infer_fast(net, img, height_size, stride, upsample_ratio, cpu)

        total_keypoints_num = 0
        all_keypoints_by_type = []
        for kpt_idx in range(num_keypoints):  # 19th for bg
            total_keypoints_num += extract_keypoints(heatmaps[:, :, kpt_idx], all_keypoints_by_type, total_keypoints_num)

        pose_entries, all_keypoints = group_keypoints(all_keypoints_by_type, pafs)
        for kpt_id in range(all_keypoints.shape[0]):
            all_keypoints[kpt_id, 0] = (all_keypoints[kpt_id, 0] * stride / upsample_ratio - pad[1]) / scale
            all_keypoints[kpt_id, 1] = (all_keypoints[kpt_id, 1] * stride / upsample_ratio - pad[0]) / scale
        current_poses = []
        for n in range(len(pose_entries)):
            if len(pose_entries[n]) == 0:
                continue
            pose_keypoints = np.ones((num_keypoints, 2), dtype=np.int32) * -1
            for kpt_id in range(num_keypoints):
                if pose_entries[n][kpt_id] != -1.0:  # keypoint was found
                    pose_keypoints[kpt_id, 0] = int(all_keypoints[int(pose_entries[n][kpt_id]), 0])
                    pose_keypoints[kpt_id, 1] = int(all_keypoints[int(pose_entries[n][kpt_id]), 1])
            pose = Pose(pose_keypoints, pose_entries[n][18])
            current_poses.append(pose)

        if track:
            track_poses(previous_poses, current_poses, smooth=smooth)
            previous_poses = current_poses
        for pose in current_poses:
            pose.draw(img)
        img = cv2.addWeighted(orig_img, 0.6, img, 0.4, 0)
        for pose in current_poses:
            cv2.rectangle(img, (pose.bbox[0], pose.bbox[1]),
                          (pose.bbox[0] + pose.bbox[2], pose.bbox[1] + pose.bbox[3]), (0, 255, 0),thickness=2)
            if track:
                cv2.putText(img, 'id: {}'.format(pose.id), (pose.bbox[0], pose.bbox[1] - 16),
                            cv2.FONT_HERSHEY_COMPLEX, 0.5, (255, 0, 255),2)
        cv2.imshow('Lightweight Human Pose Estimation Python Demo', img)
        #while (cap.isOpened()):
            #ret,img=cap.read()
            #if ret ==True:
#保存视频
        out.write(img)

        key = cv2.waitKey(33)
        if key == 27:  # esc
            return
        elif key == 112:  # 'p'
            if delay == 1:
                delay = 0
            else:
                delay = 1
#释放
    out.release()
    cap.release()

呜呜呜呜，我终于成功了，谁懂啊！！！