需求说明
拿到一批视频 ,视频内容是一些 课程的讲解,画面中都是一些ppt的页面,在视频中将ppt的画面都提取出来,并保存。
基本思路
读取视频,逐帧解析视频画面 ,对比前后两帧视频画面是否有区别,如果有区别则将图片保存,没区别则进行下一帧。
需要注意的:
- 视频画面不清晰 ,可能在视频播放过程中,有闪烁
- 视频中的内容可能存在重复(没有解决)
关键部分
代码基本逻辑没什么难点,不过在提取图片之后做前后两帧画面对比的时候,需要查验相似度,相似度结果出来之后,需要设定一个阈值,在多大范围内的相似度差异视为视频画面没有变化。
上代码
# coding=utf-8
import os
import shutil
import cv2
import numpy as np
from PIL import Image
import math
import operator
import sklearn
from sklearn.metrics.pairwise import cosine_similarity
cap = cv2.VideoCapture(r"./video/source/adb.mp4")
# 定义获取相似度的方法
def cosine_func(x,y):
cur = cosine_similarity(x[:,:,0],y[:,:,0])
return np.mean(cur)
# 算一下视频共计多少秒
fps= cap.get(cv2.CAP_PROP_FPS) # 帧率
frameCount = cap.get(cv2.CAP_PROP_FRAME_COUNT) # 帧数
frame_rate = 25
success = True
# 计数
num = 1
frame_count = 0
contrast_img = None
contrast_cosin = 0
while (success):
#cap.read()进行读,cv2.imwrite()进行写,当读结束时,success变成False
success, frame = cap.read()
frame_count = frame_count + 1
try:
frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
if contrast_img is None: # 第一次这里是空的
print("第一次")
contrast_img = frame
if success == True:
if frame_count % frame_rate == 0:
print("检查帧位置{}".format(frame_count))
cosin_num = cosine_func(contrast_img, frame) # 检查相似度
contrast_img = frame
if abs(cosin_num.round(2) - contrast_cosin) < 0.02:
print(num, cosin_num)
contrast_cosin = cosin_num.round(2)
# cv2.imshow("frame",frame_gray)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
print("#"*5)
print(frame_count,num)
cv2.imwrite(r"./image/source/u/" + "%03d.jpg" % num, frame)
num += 1
print("#"*5)
except Exception as e:
print(e)
其实可以做更多事情,将批量视频按照目录读进来,将结果保存为pdf文件
这里没有用到目标识别,没有区分重复的画面内容,甚至阈值可能不是很灵敏,会有很多相同画面,后续阅览者可以自行调试。