读取jpg文件的exif信息

最新推荐文章于 2024-05-14 03:39:25 发布

realduke2000

最新推荐文章于 2024-05-14 03:39:25 发布

阅读量4.5k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/realduke2000/article/details/21232353

版权

使用Python编写脚本，从大量的jpg照片中仅读取感兴趣的EXIF信息，对比之前使用.NET和多线程处理的情况，发现无多线程情况下速度较快，2秒内能处理约2G的测试文件，预计80G照片整理可在4分钟内完成。

摘要由CSDN通过智能技术生成

照片有点多，准备整理一下，按照片拍照的时间进行重新整理，用python写了一个，只读自己感兴趣的exif信息的脚本，看看速度怎么样。

以前用.net写过一个，用的现成的exif类库：大约开启1~5个线程来分析所有目标图片文件，读取exif信息，放入一个队列中；大约开启20个左右的线程来进行重命名、拷贝和删除原始文件。

这个程序运行起来，速度会越来越慢，一直没找到关键原因在哪，觉得可能有的原因：

瓶颈在硬盘的IO上，copy操作比较多，感觉应该是主要原因，但是无法解释为什么运行速度会越来越慢
硬件问题，老笔记本Thinkpad R60
.net本身比较慢，程序里加了强制垃圾回收，占用内存空间比较稳定，cpu占用率也不是特别高，线程比较多，但是基本互相之间没有什么资源竞争
由于照片都是单反拍的，文件大小比较大，exif信息比较多，用exifLib会读取整个图片信息并格式化所有exif信息，但是感觉对程序的性能影响比较小

刚试了一下，没有多线程，速度还挺快的，测试文件大约有2G左右，2秒以内就能完成，全部80多G的照片整理大约需要不到4分钟

# http://www.codeproject.com/Articles/43665/ExifLibrary-for-NET
# http://www.exiv2.org/tags.html
# http://www.awaresystems.be/imaging/tiff/tifftags.html

import os
import struct
import random
import datetime
import sys
import traceback

class exiftags:
	datetime = 0x0132
	datetime_original = 0x9003
	datetime_digited = 0x9004
	exifpointer = 0x8769

class log:
	visited = 0

class jpg:
	def __init__(self, file_path):
		self.__file_path = file_path
		self.__fo = None
		self.__endian = '>'
		self.__baseoffset = None
		self.exif = {}
	
	def __del__(self):
		if self.__fo is not None:
			self.__fo.close()

	def __getfo(self):
		if self.__fo is None:
			self.__fo = open(self.__file_path, 'rb')
		return self.__fo

	def __isjpg(self):
		arr = self.__getfo().read(2)
		if (arr is None) or (len(arr) < 2):
			retur

最低0.47元/天解锁文章

realduke2000

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
读取jpg文件的exif信息

照片有点多，准备整理一下，按照片拍照的时间进行重新整理，用python写了一个，只读自己感兴趣的exif信息的脚本，看看速度怎么样。以前用.net写过一个，用的现成的exif类库：大约开启1~5个线程来分析所有目标图片文件，读取exif信息，放入一个队列中；大约开启20个左右的线程来进行重命名、拷贝和删除原始文件。这个程序运行起来，速度会越来越慢，一直没找到关键原因
复制链接

扫一扫

专栏目录