python视频处理字幕_利用Python提取视频中的字幕（文字识别）

最新推荐文章于 2024-04-05 18:00:17 发布

weixin_39760065

最新推荐文章于 2024-04-05 18:00:17 发布

阅读量1k

点赞数

文章标签： python视频处理字幕

本文介绍了一个Python项目，通过视频帧截图、图片处理和百度API，实现视频中字幕的提取并保存为TXT文档。文章详细讲解了裁剪视频、灰度处理、文字识别和去重排序等步骤。

摘要由CSDN通过智能技术生成

我的CSDN博客id：qq_39783601，昵称是糖潮丽子~辣丽

从今天开始我会陆续将数据分析师相关的知识点分享在这里，包括Python、机器学习、数据库等等。

今天来分享一个Python小项目！

文字识别

项目背景

通过获取百度API实现视频文字识别。

需求阐述

将.MP4格式视频裁剪成一帧一帧的图片再将图片中的字幕摘取出来，保存成一个文档。

进入正题喽！！！

思路

1.将视频按帧截取成图片

2.将上一步截取的图片再进行裁剪,只保留字幕部分，然后在进行灰度处理

3.调用百度api识别文字

4.输出成txt

首先导包

# base64是一种将不可见字符转换为可见字符的编码方式

import base64

# opencv是跨平台计算机视觉库，实现了图像处理和计算机视觉方面的很多通用算法

import os

import cv2

import requests

from aip import AipOcr

# 百度AI的文字识别库

base64 base64是一种将不可见字符转换为可见字符的编码方式。

opencv 是跨平台计算机视觉库，实现了图像处理和计算机视觉方面的很多通用算法。

AipOcr 百度AI的文字识别库。

注意：这里from aip import AipOcr刚开始可能会报错，原因可能是aip和baidu-aip根本不是同一个包，如果想要import的时候，都是使用：import aip 之后pip install baidu-aip就没报错了。

代码详情

裁剪视频

def tailor_video():

# 要提取视频的文件名，隐藏后缀

sourceFileName = 'material'

# 在这里把后缀接上

video_path = os.path.join("G:/material/", sourceFileName + '.mp4')

times = 0

# 提取视频的频率，每10帧提取一个

frameFrequency = 10

# 输出图片到当前目录video文件夹下

outPutDirName = 'G:/material/video/' + sourceFileName + '/'

if not os.path.exists(outPutDirName):

# 如果文件目录不存在则创建目录

<

最低0.47元/天解锁文章

weixin_39760065

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python视频处理字幕_利用Python提取视频中的字幕（文字识别）

我的CSDN博客id：qq_39783601，昵称是糖潮丽子~辣丽从今天开始我会陆续将数据分析师相关的知识点分享在这里，包括Python、机器学习、数据库等等。今天来分享一个Python小项目！文字识别项目背景通过获取百度API实现视频文字识别。需求阐述将.MP4格式视频裁剪成一帧一帧的图片再将图片中的字幕摘取出来，保存成一个文档。进入正题喽！！！思路1.将视频按帧截取成图片2.将上一步截取的图片...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。