哈喽,大家好本期的主题是利用Python来实现对视频文件时间长度的读取。
在学习编程语言时,相比较于通过书本来学习知识,我更喜欢通过观看学习视频的方式来进行学习,通过主讲老师的讲解,我能很直观且快速的了解一些知识点,但是这种方式有一点让我感到无趣,因为看视频学习往往需要花费很长的时间,而且看视频过程中大多数时候都是比较枯燥的。由于平时我有另外的工作要做,我需要计划着时间来学习完这些知识点。在刚开始时,我会用很原始的方式将每一集的视频长度记录下来,接着将这一部分知识点所有的视频时间求和,然后根据我的空闲时间来决定需要多久看完这视频。
学习过一段时间后,我通过代码实现了自动读取视频时间的功能。
开始进入正题
软件:PyCharm Community 2019.1
解释器版本:Python 3.8
第三方库:et_xmlfile-1.01、jdcal-1.2、openpyxl-2.6.2、ffmpeg-e6625ca-20191004-win64-static
第三方库安装过程中并不顺利,后来我直接对这些安装包进行了解压,将“et_xmlfile”、“openpyxl”、"jdcal.py"和“ffmpeg-e6625ca-20191004-win64-static”文件放置在Lib目录下的site-packeges中。
在写代码前需要先导入一些库,以便对文件目录和数据进行存储
import os
import subprocess
import json
from openpyxl import load_workbook, Workbook
程序的实现思路我将其分为两块:1、读取视频文件目录下的文件名;2、读取视频文件的时间长度。
首先建立一个ReadVideoTime类并设置一些初始化参数:
def __init__(self, abspath, destfile):
self.abspath = abspath
self.destfile = destfile
读取视频文件目录下的文件名
实现思路如下:
1、找到所在视频文件目录的地址;
2、读取该目录下的视频文件名;
3、调用Workbook模块建立excel工作表及工作表的存储路径;
def getvideolist(self):
address_list = os.path.dirname(os.path.abspath(self.abspath)) + '\\' + self.destfile
list_filename = os.listdir(address_list)
wb = Workbook()
path = os.path.dirname(address_list) + '\\'
prefix = 'data'
surfix = '.xlsx'
newfile = prefix + surfix
excel_path = path + newfile
wb.save(excel_path)
return list_filename, excel_path, address_list
读取视频文件的时间长度
实现思路如下:
1、获取getvideolist()函数返回的视频文件名、data.xlsx的存储路径、视频文件夹目录地址;
2、调用load_workbook()开开data.xlsx用于将读取的数据存储在工作表中;
3、将表格的表头依次设定为“序号”、“文件名”及“视频时间长度(s)”;
4、读取列表的最大行和列数量,并将除表头以外的单元格值初始化为空;
5、调用windows cmd 运行ffprobe.exe 并用subprocess.Popen
新建一个子进程,将读取到的指定视频的数据转换为json字段;
6、对获取的json字段数据进行逐行读取并转码成字符串;
7、按照表头的设定规则,通过for循环逐个给单元赋值;
def write_duration_time(self):
list_filename, excel_path, address_list = self.getvideolist()
wb = load_workbook(excel_path)
sht = wb.worksheets[0]
sht["A1"] = "序号"
sht["B1"] = "文件名"
sht["C1"] = "视频时间长度(s)"
max_row = sht.max_row
max_col = sht.max_column
if max_row > 1 and max_col > 0:
for row in sht.iter_rows(min_row=2, min_col=1, max_col=max_col, max_row=max_row):
for cell in row:
cell.value = " "
for index, filename in enumerate(list_filename):
pname = 'E:\\Python批量读取视频时间\\venv\\Lib\\site-packages\\ffmpeg-20191004-e6625ca-win64-static\\bin\\ffprobe.exe -v quiet -print_format json -show_format "%s"' % (address_list + '\\' + filename)
# 输出视频文件文件名
print((self.abspath + '\\' + filename))
result = subprocess.Popen(pname, shell=True, stdout=subprocess.PIPE).stdout
# 逐行读取result内的结果
list_std = result.readlines()
str_tmp = ''
for item in list_std:
# 将list_std 中的数据转码
str_tmp += bytes.decode(item.strip())
json_data = json.loads(str_tmp)
dura_time = json_data['format']['duration']
print('dura_time:', dura_time)
#逐行给单元格赋值
sht.cell(row=index + 2, column=1, value=index+1)
sht.cell(row=index + 2, column=2, value=filename)
sht.cell(row=index + 2, column=3, value=dura_time)
# 保存工作目录
wb.save(excel_path)
print("视频时间长度数据获取成功!")
‘*** -v quiet -print_format json -show_format “%s”’ %(***)
各位读者朋友这一行代码十分有用,可以方便的通过cmd执行程序并将输出的数据转换成想要的类型。
利用Python批量读取视频文件的时间长度的代码就这么实现了,Let‘s go,现在检验下实现的效果吧!
打开想要获取视频文件时间长度的文件目录:
在执行程序时需要按照如下的方式进行文件进的输入:
请输入视频文件路径:E:\\Python中级教程\\视频-Python深入浅出\\day2视频
请输入视频文件夹:day2视频
运行时的效果如下:
执行完程序后会在excel_path对应的路径下生成一个’data.xlsx’文件,
打开文件后就可以看到视频文件名及对应的视频长度。
本期文章到此结束
我将分享更多的内容在微信公众号“老坛学Python”上,感兴趣的朋友可以去瞅瞅,我也想能够到到一个组织一起学习。