头歌python实训通关九——信息安全——计算机取证

最新推荐文章于 2023-12-09 23:26:59 发布

幕溪WM

最新推荐文章于 2023-12-09 23:26:59 发布

阅读量1k

点赞数 3

分类专栏：头歌python实训通关文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_65950075/article/details/129997885

版权

头歌python实训通关专栏收录该内容

21 篇文章 51 订阅

订阅专栏

第1关：zip压缩文件暴力破解

任务描述

本关任务：编写一个能暴力破解加密Zip文件的小程序。

第2关：PDF取证

任务描述

本关任务：编写一个能读取PDF元数据的小程序。

相关知识

曾经有一次案件，当时黑客组织发布了ANONOPS_The_Press_Release这份稿件，希腊警方在稿件的元信息中发现了作者Alex Tapanaris的名字，然后以此为证据将其逮捕，也就是所谓的电子取证。基本思路是，调用Python中的PyPDF2模块的getDocumentInfo函数，提取PDF文件中的元数据。

PyPDF2

PyPDF2是作为PDF工具包构建的python库，它能够:

提取文档信息（标题，作者，...）
按页拆分文档
逐页合并文档
裁剪页面
合并多个页面到一个页
对pdf文档进行加密解密
等等

注意，这个模块的名字对大小写是敏感的，所以，确保y是小写的，其他字母都是大写的 #####PdfFileReader 构造方法： PyPDF2.PdfFileReader(stream,strict = True,warndest = None,overwriteWarnings = True) 初始化一个 PdfFileReader 对象，此操作可能需要一些时间，因为 PDF 流的交叉引用表被读入内存。

PdfFileReader 对象的属性和方法

PdfFileWriter

这个类支持 PDF 文件，给出其他类生成的页面。

属性和方法 |描述 -|-|- addAttachment(fname,fdata) |在 PDF 中嵌入文件 addBlankPage(width= None,height=None) |追加一个空白页面到这个 PDF 文件并返回它 addBookmark(title,pagenum,parent=None,color=None,bold=False,italic=False,fit='/fit,*args') addJS(javascript) |添加将在打开此 PDF 是启动的 javascript addLink(pagenum,pagedest,rect,border=None,fit='/fit',*args) |从一个矩形区域添加一个内部链接到指定的页面 addPage(page) |添加一个页面到这个PDF 文件，该页面通常从 PdfFileReader 实例获取 getNumpages() |页数 getPage(pageNumber) |从这个 PDF 文件中检索一个编号的页面 insertBlankPage(width=None,height=None,index=0) |插入一个空白页面到这个PDF文件并返回它，如果没有指定页面大小，就使用最后一页的大小 insertPage(page,index=0) |在这个 PDF 文件中插入一个页面，该页面通常从 PdfFileReader 实例获取 removeLinks() |从次数出中删除连接盒注释 removeText(ignoreByteStringObject = False) |从这个输出中删除图像 write(stream) |将添加到此对象的页面集合写入 PDF 文件

例子

分割文档（取第五页之后的页面），取第五页之后的页面，将test.pdf第五页之后的页面分割保存到copy.pdf。 import PyPDF2 from PyPDF2 import PdfFileReader from PyPDF2 import PdfFileWriter

def splitPdf():
readFile = 'test.pdf'
outFile = 'copy.pdf'
pdfFileWriter = PdfFileWriter()
# 获取 PdfFileReader 对象
pdfFileReader = PdfFileReader(open(readFile, 'rb'))
# 文档总页数
numPages = pdfFileReader.getNumPages()
#如果pdf页数大于5，再分割
if numPages > 5:
# 从第五页之后的页面，输出到一个新的文件中，即分割文档
for index in range(5, numPages):
pageObj = pdfFileReader.getPage(index)
pdfFileWriter.addPage(pageObj)
# 添加完每页，再一起保存至文件中
pdfFileWriter.write(open(outFile, 'wb'))
splitPdf()

编程要求

现有一份来自黑客组织的PDF新闻稿step2/1.pdf。请你对1.pdf稿件解析元信息，得出黑客信息，给警方提供线索。在右侧编辑器中有一个Evidence函数，它有一个参数path，代表这个PDF的路径，或者是另一个类似的PDF文件的路径，它们的区别仅在于元数据上。请你在这个函数中读取指定新闻稿的元数据，并将其按照<属性名> : <属性值>的格式打印出来。注意：从PDF中读取的属性名会包含一些非字母符号，请在显示之前去掉这些符号。如果不知道有哪些符号，可以先输出一下原始的内容观察一下。测试数据由评测系统读取并传递给Evidence函数，期间产生的输出将会与规定的输出进行比较，详细要求请见测试说明。

测试说明

应该得到的是： Author : miao chunyu Creator : Microsoft® Word 2013 CreationDate : D:20200202141604+08'00' ModDate : D:20200202141604+08'00' Producer : Microsoft® Word 2013 即测试集1的预期输出。

# coding:utf-8
import PyPDF2
from PyPDF2 import PdfFileReader

def Evidence(path):
    #读取并打印PDF的元信息
    #   请在此添加实现代码   #
    # ********** Begin *********#
    with open (path,'rb') as file:
        pdf_reader = PyPDF2.PdfFileReader(file)
        metadata = pdf_reader.getDocumentInfo()
        for key,value in metadata.items():
            print(key.replace("/",""),":" ,value)
    # ********** End **********#

第3关：图像取证

任务描述

本关任务：编写一个能读取图像Exif头的小程序。

相关知识

警方通过某种渠道得到了一张照片，想知道照片拍摄位置，确定黑客的活动范围后将其逮捕。基本思路是，调用Python中的exifread模块的exifread.process_file函数，提取图像文件中的Exif头信息。

编程要求

现有一份来自黑客组织的泄露的照片step3/1.jpg。请你对1.jpg相片解析，得出黑客信息，给警方提供线索。请你在这个函数中读取指定相片的Exif头，并将其按照<属性名>: <属性值>的格式打印出来。测试数据由评测系统读取并传递给Evidence函数，期间产生的输出将会与规定的输出进行比较，详细要求请见测试说明。

测试说明

应该得到的是：具体型号: MI 6 图像软件: sagit-user 9 PKQ1.190118.001 9.10.17 release-keys 拍摄时间: 2019:12:10 11:56:45 GPS纬度: [22, 30, 45963/1250] N GPS经度: [114, 2, 280679/10000] E 品牌信息: Xiaomi 即测试集1的预期输出。

# coding:utf-8
import exifread

def Evidence(path):
    #读取并打印图像的Exif头信息
    #   请在此添加实现代码   #
    # ********** Begin *********#
    with open(path,'rb') as f:
        tags = exifread.process_file(f)
    camera_model = tags.get('Image Model')
    software = tags.get('Image Software')
    capture_time = tags.get('EXIF DateTimeOriginal')
    latitude_ref = tags.get('GPS GPSLatitudeRef')
    latitude = tags.get('GPS GPSLatitude')
    longitude_ref = tags.get('GPS GPSLongitudeRef')
    longitude = tags.get('GPS GPSLongitude')
    brand = tags.get('Image Make')

    print(f"具体型号: {camera_model}")
    if software !=None:
        print(f"图像软件: {software}")
    print(f"拍摄时间: {capture_time}")
    print(f"GPS纬度: {latitude} {latitude_ref}")
    print(f"GPS经度: {longitude} {longitude_ref}")
    print(f"品牌信息: {brand}")

    
    # for tag in tags.keys():
    #     if tag not in ('JPEGThumbnail', 'TIFFThumbnail', 'Filename', 'EXIF MakerNote'):
    #         print(f"{tag}: {tags[tag]}")
    # ********** End **********#