视频字幕分析

本文探讨了三种文字检测方法:基于边缘、纹理和连通区域的文字检测。这些技术利用图像处理,通过边缘对比、纹理属性差异和连通区域分析来识别文字。垂直投影法在字符分割中起到关键作用,通过灰度投影可以有效地分割和识别字符。提供的资源包含了视频字幕分析的MATLAB程序实现。
摘要由CSDN通过智能技术生成

主要的方法

本文中,没有涉及到BP识别

①基于边缘的文字检测

文字具有的高密度性与背景图形成鲜明对比,反应在图像上文字则有丰富的边缘信息,可以通过文字边缘检测得到原图像,通过图像处理技术利用文字与背景之间的对比度进行相应过滤, 

②基于纹理的文字检测

由特殊笔画组成的文字与线条型填充型的背景区域在纹理上存在一定的区别,基于纹理的文字检测就是利用背景与文字的纹理属性不同而做的图像识别,将有文字特性的纹理提取出来。

③基于连通区域的文字检测

基于部分图像描述字体普遍使用统一底色,导致和背景色形成鲜明的对比度,利用基本的图像分割算法将区域色从背景图像中分离出来,再经过文字特有的笔画构造对连通区域进行分析,排除非文字区域,然后经过优化得到文字块

垂直投影法

垂直投影的具体算法是在文本字符的垂直投影图上的横向从左侧到右侧依次检测每一个坐标的投影数值,将检测到的投影数值出现第一个不为0时,那么将这个投影数值所属的像素点即看作是第一个投影区域的左边界限。然后继续向右检测,

以在文本垂直投影区域中清晰的看到3个区域,即文本的3个字符灰度图像的垂直投影,通过垂直投影图的特征,分割字符就转化为只需得到每个区域左右边界即可, 

图5.4.1旋转后的文本垂直投影

图 视频字幕分析

图 可以看出 灰度投影的技术研究

可以看出 将数据分割出啦 ,并且可以得到有关的数据

  

可以看出数据的结果

通过灰度投影可以将数据投影显示出来

具体源程序见:视频字幕分析-matlab-Matlab文档类资源-CSDN下载

如有侵权,请联系作者删除。

本文的视频人脸检测识别方法的基本设计思想是,在给出一段视频文件以及这个视频文件的字幕和剧本之后,可以自动的对视频中的人物进行检测和识别,不需要任何的训练样本。视频人脸检测识别方法主要由四个部分组成:字幕剧本融合部分,人脸检测部分,样本集自动生成部分和基于深度学习的人脸识别部分。本文将深度学习算法引入到了视频人脸识别中来,有两方面的重要意义,一方面,视频人脸的识别要求算法具备一定的抗干扰能力,并且能够保证一定的实时性,本文的实验与分析表明,深度学习算法具备这方面的要求;另一方面,从深度学习算法特性的角度来说,深度学习算法最大的缺点就是构造深度模型需要大量的样木,这很大程度上限制了深度学习算法的应用,然而本文所设计的基于视频的人脸检测模块可以轻松的产生数万、数十万的样本,从而满足了深度学习算法的大样本集要求。 基于深度学习模型的人脸识别部分是整个系统的重点,这一部分主要有两方面的意义:一,经历了视频人脸的检测部分之后,虽然视频人脸集合中人脸的纯度有了很大的提升,但是依然会存在一些杂质,因此必须通过识别模块来进一步的过滤掉人脸集合中的杂质;二,通过视频所得到的帧文件中,经常会出现多张人脸同时出现的情况,在这种情况下,视频人脸的检测部分是无法将说话者与人脸进行对应的,必须通过识别模块才能区分出一个帧中的多个人脸。 基于深度学习模型的人脸识别部分主要包含三个模块:数据预处理模块、深度学习模块和识别模块。数据预处理模块主要由数据整合和构造数据立方体两个部分组成。深度学习模块通过两个具体过程来实现:RBM调节和深度模型的反馈微调。RBM的调节过程是自下而上的各个层间的调节过程,以这种方式来初始化整个深度模型的系统权值,而深度模型的反馈微调,首先进行自下而上的识别模型转换,然后再进行自上而下的生成模型转换,最后通过不同层次之间的不断调节,使生成模型可以重构出具有较低误差的原样本,这样就得到了此样本的本质特征,即深度模型的最高抽象表示形式。经过深度学习模型的处理,可以得到降维之后的样本特征,在此基础上运用识别模块,本文中所采用的识别方法是人工神经网络的识别方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能专属驿站

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值