在一个庞大的MP3文件集合中,有可能同一首歌有多个副本,保存在不同的目录中,
或者文件名不同,这个练习的目的是搜索重复的歌
1, 编写一个程序递归搜索目录及其所有的子目录,并返回所有指定的后缀(如.MP3)的文件的完整路径的列表。
提示:os.path 提供了几个有用的方法来操纵文件和路径
2, 要发现重复的文件,需要使用md5sum 来计算每个文件的 校验和 。 如果两个文件的校验和相同,它们很有可能有相同的内容。
3, 你可以使用Unix 命令 diff来复审检验。
在一个庞大的MP3文件集合中,有可能同一首歌有多个副本,保存在不同的目录中,
或者文件名不同,这个练习的目的是搜索重复的歌
1, 编写一个程序递归搜索目录及其所有的子目录,并返回所有指定的后缀(如.MP3)的文件的完整路径的列表。
提示:os.path 提供了几个有用的方法来操纵文件和路径
2, 要发现重复的文件,需要使用md5sum 来计算每个文件的 校验和 。 如果两个文件的校验和相同,它们很有可能有相同的内容。
3, 你可以使用Unix 命令 diff来复审检验。