视频中提取图片信息和声音信息

最新推荐文章于 2023-06-24 23:08:01 发布

情绪识别博士

最新推荐文章于 2023-06-24 23:08:01 发布

阅读量798

点赞数 1

分类专栏：情绪识别文章标签： python 人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39495934/article/details/107460041

版权

情绪识别专栏收录该内容

14 篇文章 7 订阅

订阅专栏

随着某音，某拍小视频的流行，视频中的物理要素变得尤为重要，通过提起视频中的物理要素，判断视频对人们情绪的刺激，将是未来一个重要的话题。

视频中的重要信息包括图片和声音。

图片又可以从每帧的RGB，HSV，Lab得到特征值。

声音有很多方式的提取，这里列举三种。1.将声音转为数据信息，将数据信息通过FFT分析，提取每秒的frequency和power。

2.使用MFCC中提取的12个倒波系数作为特征值。3.将每帧数据先进行SFTF的变换为RGB图片。从RGB图片中提取R，G，B三个变量作为声音的amplitude。

个人认为第三种方法更容易理解，但是第三种方法在数据处理过程中比较耗时间。

欢迎大家提更多宝贵意见

情绪识别博士

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。