在早期学Python的时候,买了一本《Python编程快速上手-让繁琐工作自动化》。
这本书里面讲得都比较基础,不过却非常的实用。
估计从书名大家伙们就应该能体会到。
本次根据书中的「读写文件」章节内容,实现一个简单又实用的小操作。
涉及到的模块有os、hashlib、shutil。
利用这三个模块实现对文件夹中的重复视频进行清除,实现文件夹中无重复文件情况发生。
/ 01 / 科普
在进行代码操作前,简单对相关知识做个简单的学习。
毕竟我们不能停留在表象,要去明白它们的原理。
这样才能做到举一反三,提高学习效率。
01 二进制文件
二进制文件是以文本的二进制形式存储在计算机中。
用户一般不能直接读取它们,需要通过相应的软件才能将其显示出来。
二进制文件一般是可执行程序、图形、图像、声音等等。
本次实现的就是图像类型的文件,即视频!
02 摘要算法(MD5)
摘要算法又称哈希算法、散列算法。
它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
即通过摘要函数对任意长度的数据(data)计算出固定长度的摘要(digest)。
目的是为了发现原始数据是否被人篡改过。
摘要算法之所以能指出数据是否被篡改过,是因为摘要函数是一个单向函数&