照片有点多,准备整理一下,按照片拍照的时间进行重新整理,用python写了一个,只读自己感兴趣的exif信息的脚本,看看速度怎么样。
以前用.net写过一个,用的现成的exif类库:大约开启1~5个线程来分析所有目标图片文件,读取exif信息,放入一个队列中;大约开启20个左右的线程来进行重命名、拷贝和删除原始文件。
这个程序运行起来,速度会越来越慢,一直没找到关键原因在哪,觉得可能有的原因:
- 瓶颈在硬盘的IO上,copy操作比较多,感觉应该是主要原因,但是无法解释为什么运行速度会越来越慢
- 硬件问题,老笔记本Thinkpad R60
- .net本身比较慢,程序里加了强制垃圾回收,占用内存空间比较稳定,cpu占用率也不是特别高,线程比较多,但是基本互相之间没有什么资源竞争
- 由于照片都是单反拍的,文件大小比较大,exif信息比较多,用exifLib会读取整个图片信息并格式化所有exif信息,但是感觉对程序的性能影响比较小
刚试了一下,没有多线程,速度还挺快的,测试文件大约有2G左右,2秒以内就能完成,全部80多G的照片整理大约需要不到4分钟
# http://www.codeproject.com/Articles/43665/ExifLibrary-for-NET
# http://www.exiv2.org/tags.html
# http://www.awaresystems.be/imaging/tiff/tifftags.html
import os
import struct
import random
import datetime
import sys
import traceback
class exiftags:
datetime = 0x0132
datetime_original = 0x9003
datetime_digited = 0x9004
exifpointer = 0x8769
class log:
visited = 0
class jpg:
def __init__(self, file_path):
self.__file_path = file_path
self.__fo = None
self.__endian = '>'
self.__baseoffset = None
self.exif = {}
def __del__(self):
if self.__fo is not None:
self.__fo.close()
def __getfo(self):
if self.__fo is None:
self.__fo = open(self.__file_path, 'rb')
return self.__fo
def __isjpg(self):
arr = self.__getfo().read(2)
if (arr is None) or (len(arr) < 2):
retur