读取jpg文件的exif信息

使用Python编写脚本,从大量的jpg照片中仅读取感兴趣的EXIF信息,对比之前使用.NET和多线程处理的情况,发现无多线程情况下速度较快,2秒内能处理约2G的测试文件,预计80G照片整理可在4分钟内完成。
摘要由CSDN通过智能技术生成

照片有点多,准备整理一下,按照片拍照的时间进行重新整理,用python写了一个,只读自己感兴趣的exif信息的脚本,看看速度怎么样。



以前用.net写过一个,用的现成的exif类库:大约开启1~5个线程来分析所有目标图片文件,读取exif信息,放入一个队列中;大约开启20个左右的线程来进行重命名、拷贝和删除原始文件。


这个程序运行起来,速度会越来越慢,一直没找到关键原因在哪,觉得可能有的原因:

  1. 瓶颈在硬盘的IO上,copy操作比较多,感觉应该是主要原因,但是无法解释为什么运行速度会越来越慢
  2. 硬件问题,老笔记本Thinkpad R60
  3. .net本身比较慢,程序里加了强制垃圾回收,占用内存空间比较稳定,cpu占用率也不是特别高,线程比较多,但是基本互相之间没有什么资源竞争
  4. 由于照片都是单反拍的,文件大小比较大,exif信息比较多,用exifLib会读取整个图片信息并格式化所有exif信息,但是感觉对程序的性能影响比较小

刚试了一下,没有多线程,速度还挺快的,测试文件大约有2G左右,2秒以内就能完成,全部80多G的照片整理大约需要不到4分钟



# http://www.codeproject.com/Articles/43665/ExifLibrary-for-NET
# http://www.exiv2.org/tags.html
# http://www.awaresystems.be/imaging/tiff/tifftags.html

import os
import struct
import random
import datetime
import sys
import traceback

class exiftags:
	datetime = 0x0132
	datetime_original = 0x9003
	datetime_digited = 0x9004
	exifpointer = 0x8769

class log:
	visited = 0

class jpg:
	def __init__(self, file_path):
		self.__file_path = file_path
		self.__fo = None
		self.__endian = '>'
		self.__baseoffset = None
		self.exif = {}
	
	def __del__(self):
		if self.__fo is not None:
			self.__fo.close()

	def __getfo(self):
		if self.__fo is None:
			self.__fo = open(self.__file_path, 'rb')
		return self.__fo

	def __isjpg(self):
		arr = self.__getfo().read(2)
		if (arr is None) or (len(arr) < 2):
			retur
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值