[原创]使用python对视频/音频文件进行详细信息采集,并进行去重操作
转载请注明出处
一.关于为什么用pymediainfo以及pymediainfo的安装
使用python对视频/音频文件进行详细信息采集,并进行去重操作的核心是使用pymediainfo这个库
之前本人一直在试着用moviepy库中的VideoFileClip来获取视频/音频文件的详细信息,但效果不理想,一直报错根本无法解决.
直到本人发现了pymediainfo这个库,问题才得到解决(pymediainfo可以获取极其详细的音频/视频文件的具体信息).
pymediainfo的安装:(参考https://www.jianshu.com/p/4c115bd82774)
1.pip install pymediainfo 或者 python -m pip install pymediainfo
2.然后到官网下载该程序,(官网地址: https://pypi.org/project/pymediainfo/),安装到指定文件夹
3.特别重要的一步:到你安装pymediainfo的文件夹中找到MediaInfo.dll这个文件,把它复制到你Python的根目录下(不复制程序会报无法打开xx程序的错!)
二.视频/音频去重的简单逻辑:
如果两个视频/音频文件的大小完全一致,而且时长也完全一致,则该两个文件极有可能是重复的.
三.代码实现:
下面代码你只需要把
file_dir = r"D:\Movie\180919"
dire_dir = r'D:\Movie\BBB'
更改成你自己的绝对路径就可以了(file_dir是你视频/音频文件的目录, dire_dir是将重复视频文件移动至的目录,程序结束后file_dir目录中的重复文件会被移动到dire_dir)
注意:file_dir路径里只能放音频,视频文件,放入其他文件可能会报错(本人只考虑了file_dir中只有视频/音频文