video2tfrecord 项目教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01035/article/details/141737811

video2tfrecord 项目教程

video2tfrecordEasily convert RGB video data (e.g. .avi) to the TensorFlow tfrecords file format for training e.g. a NN in TensorFlow. This implementation allows to limit the number of frames per video to be stored in the tfrecords.项目地址:https://gitcode.com/gh_mirrors/vi/video2tfrecord

1. 项目的目录结构及介绍

video2tfrecord/
├── README.md
├── setup.py
├── video2tfrecord/
│   ├── __init__.py
│   ├── convert.py
│   ├── example.py
│   └── utils.py
└── tests/
    └── test_convert.py

README.md: 项目说明文档，包含项目的基本介绍和使用方法。
setup.py: 项目的安装脚本，用于通过 pip 安装项目。
video2tfrecord/: 项目的主要代码目录。
- init.py: 初始化文件，使得 video2tfrecord 成为一个 Python 包。
- convert.py: 核心转换脚本，负责将视频转换为 TensorFlow 的 tfrecord 格式。
- example.py: 示例脚本，展示如何使用 convert.py 进行视频转换。
- utils.py: 工具函数脚本，包含一些辅助函数。
tests/: 测试目录，包含项目的单元测试。
- test_convert.py: 针对 convert.py 的单元测试。

2. 项目的启动文件介绍

项目的启动文件是 video2tfrecord/convert.py。这个文件包含了主要的转换函数 convert_videos_to_tfrecord，用于将视频文件转换为 TensorFlow 的 tfrecord 格式。

from video2tfrecord import convert_videos_to_tfrecord

convert_videos_to_tfrecord(source_path, destination_path, n_videos_in_record, n_frames_per_video, "*avi")

source_path: 源视频文件夹路径。
destination_path: 目标 tfrecord 文件夹路径。
n_videos_in_record: 每个 tfrecord 文件包含的视频数量。
n_frames_per_video: 每个视频包含的帧数。
file_suffix: 视频文件的后缀名。

3. 项目的配置文件介绍

项目没有明确的配置文件，但可以通过修改 convert.py 中的参数来配置转换过程。例如，可以修改 n_videos_in_record 和 n_frames_per_video 来调整每个 tfrecord 文件包含的视频数量和每个视频包含的帧数。

def convert_videos_to_tfrecord(source_path, destination_path, n_videos_in_record=10, n_frames_per_video='all', file_suffix="*mp4", dense_optical_flow=True, width=1280, height=720, color_depth="uint8", video_filenames=None):
    """
    开始将视频文件转换为 tfrecord 文件的过程。
    """
    # 转换逻辑

n_videos_in_record: 每个 tfrecord 文件包含的视频数量，默认为 10。
n_frames_per_video: 每个视频包含的帧数，默认为 'all'，表示所有帧。
file_suffix: 视频文件的后缀名，默认为 "*mp4"。
dense_optical_flow: 是否启用密集光流，默认为 True。
width: 视频宽度，默认为 1280。
height: 视频高度，默认为 720。
color_depth: 颜色深度，默认为 "uint8"。
video_filenames: 视频文件名列表，默认为 None。

通过调整这些参数，可以灵活地配置视频转换过程。