项目实训—场景划分(二)

本文详细介绍了LGSS算法在场景划分中的数据集、预处理、模型训练及测试过程。数据集包括音频、地点特征文件和镜头切分结果;预处理涉及音频和地点特征提取以及镜头切割;模型训练测试主要由run.py、lgss.py和配置文件完成,最后在run文件夹保存结果。
摘要由CSDN通过智能技术生成

LGSS算法代码结构分析

1、数据集说明 data

(1)aud_feat 音频特征文件:shot-level 的音频特征,格式为 npy,用于场景分割训练,运行 python audio/extract_feat.py 生成该文件;
​ (2) place_feat 地点特征文件:shot-level 粒度的地点图像特征,格式为 npy,用于场景分割训练,运行 python place/extract_feat.py 生成该文件;
​(3)shot_stats, shot_txt,shot_keyf 等文件:镜头切分结果相关文件,shot_keyf 保存了每个镜头里的3个img格式的帧图像,shot_stats 保存了每一帧的时间码、hsv、lvu信息,文件格式为csv,shot_txt 保存了每个镜头的开始/结束的时间/帧,格式为txt;
(4)scene_video:最终的场景切分结果,为多个MP4文件;
(5)video:原视频所在文件夹
请添加图片描述

2、数据预处理 pre

数据预处理模块主要分为音频特征提取(audio)、地点特征提取(place)以及镜头切割(ShotDetect)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值