Python 自动化脚本系列：第5集

codeory

于 2024-05-14 08:57:32 发布

阅读量539

点赞数 6

分类专栏： Python 文章标签： python 自动化

本文链接：https://blog.csdn.net/Tory2/article/details/138836547

版权

Python 专栏收录该内容

51 篇文章 0 订阅

订阅专栏

41. 使用 cryptography 库自动化文件加密

Python 的 cryptography 库提供了一种使用对称加密算法加密和解密文件的安全方式。你可以自动化加密和解密文件的过程，以保护敏感数据。

示例：使用 Fernet 加密和解密文件

假设你想使用 Fernet 对称加密算法加密一个文件，然后再解密它。以下是如何使用 cryptography 库自动化此任务的方法：

from cryptography.fernet import Fernet  
  
# 要加密的文件  
file_to_encrypt = 'sensitive_data.txt'  
  
# 生成一个密钥  
key = Fernet.generate_key()  
  
# 使用该密钥创建一个 Fernet 密码器  
cipher = Fernet(key)  
  
# 读取文件内容  
with open(file_to_encrypt, 'rb') as file:  
    data = file.read()  
  
# 加密数据  
encrypted_data = cipher.encrypt(data)  
  
# 将加密数据写入新文件  
with open('encrypted_file.txt', 'wb') as file:  
    file.write(encrypted_data)  
  
print("文件成功加密。")  
  
# 解密文件  
with open('encrypted_file.txt', 'rb') as file:  
    encrypted_data = file.read()  
  
decrypted_data = cipher.decrypt(encrypted_data)  
  
# 将解密数据写入新文件  
with open('decrypted_file.txt', 'wb') as file:  
    file.write(decrypted_data)  
  
print("文件成功解密。")

这段代码片段使用 Fernet.generate_key() 生成一个随机加密密钥。然后，它使用生成的密钥创建一个 Fernet 密码器。它以二进制模式 (‘rb’) 使用 open() 读取要加密的文件的内容。然后使用 Fernet 密码器的 encrypt() 方法加密数据。加密的数据使用二进制写模式 (‘wb’) 的 open() 写入名为 ‘encrypted_file.txt’ 的新文件中。为了解密文件，它从 ‘encrypted_file.txt’ 读取加密数据，并使用 Fernet 密码器的 decrypt() 方法解密。解密的数据随后被写入名为 ‘decrypted_file.txt’ 的新文件中。最后，它打印出成功加密和解密文件的消息。

42. 使用 Pillow 自动化图片水印处理

Python 的 Pillow 库提供了图像处理功能，包括向图像添加水印。你可以自动化为多张图片添加特定文本或标志的水印的过程。

示例：向图片添加文本水印

假设你想为一批图片添加文本水印。以下是如何使用 Pillow 库自动化此任务的方法：

from PIL import Image, ImageDraw, ImageFont  
import os  
  
# 包含图片的目录  
image_directory = 'path/to/image/directory'  
  
# 水印文本和字体  
watermark_text = 'Your Watermark'  
font = ImageFont.truetype('arial.ttf', 36)  
  
# 遍历目录中的图片  
for filename in os.listdir(image_directory):  
    if filename.endswith('.jpg') or filename.endswith('.png'):  
        # 打开图片  
        image_path = os.path.join(image_directory, filename)  
        image = Image.open(image_path)  
        # 创建绘图上下文  
        draw = ImageDraw.Draw(image)  
          
        # 计算水印位置  
        text_width, text_height = draw.textsize(watermark_text, font)  
        x = image.width - text_width - 10  
        y = image.height - text_height - 10  
          
        # 在图片上绘制水印  
        draw.text((x, y), watermark_text, font=font, fill=(255, 255, 255, 128))  
          
        # 保存加水印后的图片  
        watermarked_filename = f"watermarked_{filename}"  
        watermarked_path = os.path.join(image_directory, watermarked_filename)  
        image.save(watermarked_path)  
          
        print(f"水印添加完成: {filename}")

这段代码片段遍历指定目录中的图片。它检查每个文件是否以 ‘.jpg’ 或 ‘.png’ 扩展名结尾，以识别图像文件。对于每个图像文件，它使用 Pillow 库的 Image.open() 打开图像。它使用 ImageDraw.Draw() 创建一个绘图上下文，以便在图像上绘图。它根据图像尺寸和文本大小计算水印文本的位置。水印定位在图像的右下角，略微偏移。使用绘图上下文的 text() 方法，它在图像上绘制指定字体、大小和颜色（带透明度的白色）的水印文本。使用 save() 方法，加水印后的图像以 ‘watermarked_’ 前缀的新文件名保存。最后，它打印出完成图像加水印过程的消息。

43. 使用 PyPDF2 自动化提取文件元数据

Python 的 PyPDF2 库允许你从 PDF 文件中提取元数据。你可以自动化从多个 PDF 文件中提取特定元数据字段的过程。

示例：从 PDF 文件中提取作者和标题

假设你有一个包含 PDF 文件的目录，你想从每个文件中提取作者和标题的元数据。以下是如何使用 PyPDF2 库自动化此任务的方法：

import os  
from PyPDF2 import PdfFileReader  
  
# 包含 PDF 文件的目录  
pdf_directory = 'path/to/pdf/directory'  
  
# 遍历目录中的 PDF 文件  
for filename in os.listdir(pdf_directory):  
    if filename.endswith('.pdf'):  
        # 打开 PDF 文件  
        pdf_path = os.path.join(pdf_directory, filename)  
        with open(pdf_path, 'rb') as file:  
            # 创建 PDF 阅读器对象  
            pdf_reader = PdfFileReader(file)  
              
            # 提取元数据  
            metadata = pdf_reader.getDocumentInfo()  
            author = metadata.get('/Author', '未知')  
            title = metadata.get('/Title', '未知')  
              
            print(f"文件: {filename}")  
            print(f"作者: {author}")  
            print(f"标题: {title}")  
            print("---")  
  
print("元数据提取完成。")

这段代码片段遍历指定目录中的 PDF 文件。它检查每个文件是否以 ‘.pdf’ 扩展名结尾，以识别 PDF 文件。对于每个 PDF 文件，它以二进制读模式 (‘rb’) 使用 open() 打开文件。它从 PyPDF2 库创建一个 PdfFileReader 对象来读取 PDF 文件。使用 PDF 阅读器对象的 getDocumentInfo() 方法，它检索 PDF 文件的元数据字典。它使用 get() 方法提取作者和标题元数据字段，如果字段不存在，提供默认值 ‘未知’。对于每个 PDF 文件，它会打印出作者和标题的提取元数据，以及文件名，用一行破折号分隔。最后，它打印出完成元数据提取过程的消息。

44. 利用 lzma 实现文件压缩和解压自动化

Python 的 lzma 模块支持使用 LZMA 压缩算法来压缩和解压文件。你可以自动化文件压缩过程，以节省存储空间并减少文件传输时间。

示例：使用 LZMA 压缩和解压文件

假如你想使用 LZMA 压缩一个文件，然后再解压它。以下是如何使用 Python 自动化此任务的方法：

import lzma  

# 要压缩的文件  
file_to_compress = 'example.txt'  

# 压缩文件  
with open(file_to_compress, 'rb') as file_in:  
    with lzma.open(file_to_compress + '.xz', 'wb') as file_out:  
        file_out.write(file_in.read())  

print("文件成功压缩。")  

# 解压文件  
with lzma.open(file_to_compress + '.xz', 'rb') as file_in:  
    with open('decompressed_file.txt', 'wb') as file_out:  
        file_out.write(file_in.read())  

print("文件成功解压。")

这段代码片段使用二进制模式 (‘rb’) 读取要压缩的文件内容，然后使用 lzma.open() 以二进制写模式 (‘wb’) 创建一个新的 LZMA 文件，文件名与原文件相同，扩展名为 ‘.xz’。原文件的内容通过 write() 写入 LZMA 文件。为了解压文件，它使用 lzma.open() 以二进制读模式 (‘rb’) 打开 LZMA 文件，然后将解压后的内容写入名为 ‘decompressed_file.txt’ 的新文件。最后，它打印出成功压缩和解压文件的消息。

45. 使用 PyCrypto 自动化文件加密

Python 的 PyCrypto 库提供了安全加密和解密文件的加密原语。你可以自动化使用对称加密算法加密和解密文件的过程。

示例：使用 AES 加密和解密文件

假如你想使用 AES 加密算法加密一个文件，然后再解密它。以下是如何使用 PyCrypto 自动化此任务的方法：

from Crypto.Cipher import AES  
from Crypto.Random import get_random_bytes  

# 要加密的文件  
file_to_encrypt = 'sensitive_data.txt'  

# 生成一个随机加密密钥  
key = get_random_bytes(16)  

# 创建一个 AES 密码对象  
cipher = AES.new(key, AES.MODE_EAX)  

# 读取文件内容  
with open(file_to_encrypt, 'rb') as file:  
    plaintext = file.read()  

# 加密数据  
ciphertext, tag = cipher.encrypt_and_digest(plaintext)  

# 将加密数据写入新文件  
with open('encrypted_file.bin', 'wb') as file:  
    [file.write(x) for x in (cipher.nonce, tag, ciphertext)]  

print("文件成功加密。")  

# 解密文件  
with open('encrypted_file.bin', 'rb') as file:  
    nonce, tag, ciphertext = [file.read(x) for x in (16, 16, -1)]  

cipher = AES.new(key, AES.MODE_EAX, nonce)  
plaintext = cipher.decrypt_and_verify(ciphertext, tag)  

# 将解密数据写入新文件  
with open('decrypted_file.txt', 'wb') as file:  
    file.write(plaintext)  

print("文件成功解密。")

这段代码片段使用 get_random_bytes() 生成一个随机加密密钥。它使用密钥和 EAX 模式创建一个 AES 密码对象。它读取要加密的文件内容，并使用密码对象的 encrypt_and_digest() 方法加密数据。加密数据连同 nonce 和 tag 一起写入名为 ‘encrypted_file.bin’ 的新文件。为了解密文件，它从加密文件中读取 nonce、tag 和密文。它使用相同的密钥和 nonce 创建一个新的 AES 密码对象。使用 decrypt_and_verify() 方法解密密文并使用 tag 验证完整性。然后将解密的数据写入名为 ‘decrypted_file.txt’ 的新文件。

46. 使用 Dropbox API 自动化文件同步

Python 提供了与各种云存储服务（如 Dropbox）交互的库。你可以使用 Dropbox API 自动化本地机器与 Dropbox 之间文件的同步过程。

示例：与 Dropbox 同步文件

假设你想同步本地机器与 Dropbox 之间的特定文件。以下是如何使用 Dropbox API 自动化此任务的方法：

import dropbox  
import os  

# Dropbox 访问令牌  
ACCESS_TOKEN = 'your_access_token'  

# 要同步的本地目录  
local_directory = '/path/to/local/directory'  

# 要同步的 Dropbox 目录  
dropbox_directory = '/path/to/dropbox/directory'  

# 创建 Dropbox 客户端  
dbx = dropbox.Dropbox(ACCESS_TOKEN)  

# 从本地同步文件到 Dropbox  
for root, dirs, files in os.walk(local_directory):  
    for filename in files:  
        local_path = os.path.join(root, filename)  
        relative_path = os.path.relpath(local_path, local_directory)  
        dropbox_path = os.path.join(dropbox_directory, relative_path)  
          
        with open(local_path, 'rb') as f:  
            dbx.files_upload(f.read(), dropbox_path, mode=dropbox.files.WriteMode.overwrite)  
            print(f"已上传: {local_path} -> {dropbox_path}")  

# 从 Dropbox 同步文件到本地  
for entry in dbx.files_list_folder(dropbox_directory).entries:  
    if isinstance(entry, dropbox.files.FileMetadata):  
        dropbox_path = entry.path_display  
        local_path = os.path.join(local_directory, os.path.relpath(dropbox_path, dropbox_directory))  
          
        if not os.path.exists(os.path.dirname(local_path)):  
            os.makedirs(os.path.dirname(local_path))  
          
        _, response = dbx.files_download(dropbox_path)  
        with open(local_path, 'wb') as f:  
            f.write(response.content)  
            print(f"已下载: {dropbox_path} -> {local_path}")  

print("文件同步完成。")

这段代码片段假设你已经获取了 Dropbox API 的访问令牌。你需要将 'your_access_token' 替换为你实际的访问令牌。它定义了要同步的本地目录和 Dropbox 目录。然后，它使用 dropbox.Dropbox() 构造函数创建一个 Dropbox 客户端，传递访问令牌。为了从本地目录同步文件到 Dropbox，它使用 os.walk() 遍历本地目录。对于每个文件，它构造本地路径和相应的 Dropbox 路径。它读取文件内容并使用 files_upload() 方法上传到 Dropbox，覆盖任何现有文件。为了从 Dropbox 同步文件到本地目录，它使用 files_list_folder() 检索 Dropbox 目录中的文件列表。对于每个文件条目，它构造 Dropbox 路径和相应的本地路径。如果不存在必要的目录，它使用 os.makedirs() 创建目录。然后，它使用 files_download() 下载文件内容并将其写入本地文件。最后，它打印出完成文件同步过程的消息。

47. 使用 py7zr 自动化文件压缩和归档

Python 的 py7zr 库允许你创建和提取 7z 归档文件。你可以自动化将文件压缩并归档到 7z 归档中的过程，以及从 7z 归档中提取文件的过程。

示例：创建和提取 7z 归档

假设你想创建一个包含多个文件的 7z 归档，然后从归档中提取这些文件。以下是如何使用 py7zr 库自动化此任务的方法：

import py7zr  

# 要归档的文件  
files_to_archive = ['file1.txt', 'file2.txt', 'file3.txt']  

# 7z 归档的名称  
archive_name = 'example.7z'  

# 创建 7z 归档  
with py7zr.SevenZipFile(archive_name, 'w') as archive:  
    for file in files_to_archive:  
        archive.write(file)  

print("7z 归档成功创建。")  

# 从 7z 归档中提取文件  
with py7zr.SevenZipFile(archive_name, 'r') as archive:  
    archive.extractall()  

print("文件成功提取。")

这段代码片段定义了要包含在 7z 归档中的文件列表和归档的名称。它使用 py7zr.SevenZipFile() 以写模式（‘w’）打开 7z 归档。然后，它遍历要归档的文件，并使用 write() 方法将每个文件添加到归档中。为了从 7z 归档中提取文件，它以读模式（‘r’）使用 py7zr.SevenZipFile() 打开归档。使用 extractall() 方法从归档中提取所有文件。最后，它打印出成功创建 7z 归档和从归档中提取文件的消息。

48. 使用 PyCryptodome 自动化文件加密

Python 的 PyCryptodome 库提供了安全加密和解密文件的加密原语。你可以自动化使用对称加密算法加密和解密文件的过程。

示例：使用 AES 加密和解密文件

假设你想使用 AES 加密算法加密一个文件，然后再解密它。以下是如何使用 PyCryptodome 自动化此任务的方法：

from Crypto.Cipher import AES  
from Crypto.Random import get_random_bytes  

# 要加密的文件  
file_to_encrypt = 'sensitive_data.txt'  

# 生成一个随机加密密钥  
key = get_random_bytes(16)  

# 创建一个 AES 密码对象  
cipher = AES.new(key, AES.MODE_EAX)  

# 读取文件内容  
with open(file_to_encrypt, 'rb') as file:  
    plaintext = file.read()  

# 加密数据  
ciphertext, tag = cipher.encrypt_and_digest(plaintext)  

# 将加密数据写入新文件  
with open('encrypted_file.bin', 'wb') as file:  
    [file.write(x) for x in (cipher.nonce, tag, ciphertext)]  

print("文件成功加密。")  

# 解密文件  
with open('encrypted_file.bin', 'rb') as file:  
    nonce, tag, ciphertext = [file.read(x) for x in (16, 16, -1)]  

cipher = AES.new(key, AES.MODE_EAX, nonce)  
plaintext = cipher.decrypt_and_verify(ciphertext, tag)  

# 将解密数据写入新文件  
with open('decrypted_file.txt', 'wb') as file:  
    file.write(plaintext)  

print("文件成功解密。")

49. 情感分析

情感分析是确定文本中表达的情感或情绪的过程。你可以使用 Python 库如 NLTK 或 TextBlob 自动化情感分析。

示例：分析电影评论的情感

假设你有一组电影评论数据，你想分析每条评论的情感。以下是如何使用 TextBlob 自动化此任务的方法：

from textblob import TextBlob  

# 电影评论  
reviews = [  
    "这部电影太棒了！演技一流，情节吸引人。",  
    "我不喜欢这部电影。故事预测性强，角色单一。",  
    "这部影片有它的时刻，但总体上是让人失望的。节奏慢，结局不满意。"  
]  

# 对每条评论进行情感分析  
for review in reviews:  
    blob = TextBlob(review)  
    sentiment = blob.sentiment  
      
    print("评论:", review)  
    print("情感极性:", sentiment.polarity)  
    print("情感主观性:", sentiment.subjectivity)  
    print("---")

这段代码片段定义了一组电影评论。然后，它遍历每条评论，并从评论文本创建一个 TextBlob 对象。TextBlob 对象的 sentiment 属性提供情感分析结果。polarity 分数从 -1（负面情感）到 1（正面情感）变化，而 subjectivity 分数从 0（客观）到 1（主观）变化。为每条评论打印情感分析结果，包括极性和主观性分数。