【PyTorch】深度学习实战 ——基于主动学习策略处理Mnist分类任务

最新推荐文章于 2024-07-19 22:29:08 发布

猫头虎-人工智能

最新推荐文章于 2024-07-19 22:29:08 发布

阅读量1k

点赞数 8

分类专栏： Python 人工智能文章标签：深度学习 pytorch 分类 bug python 人工智能 flask

猫头虎@版权

本文链接：https://blog.csdn.net/weixin_61514920/article/details/137528044

版权

人工智能同时被 2 个专栏收录

99 篇文章 0 订阅

订阅专栏

Python

4 篇文章 0 订阅

订阅专栏

博主猫头虎的技术世界

🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能！

专栏链接：

🔗 精选专栏：

《面试题大全》 — 面试准备的宝典！
《IDEA开发秘籍》 — 提升你的IDEA技能！
《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师！
《100天精通Golang（基础入门篇）》 — 踏入Go语言世界的第一步！
《100天精通Go语言（精品VIP版）》 — 踏入Go语言世界的第二步！

领域矩阵：

🌐 猫头虎技术领域矩阵：
深入探索各技术领域，发现知识的交汇点。了解更多，请访问：

猫头虎技术矩阵
新矩阵备用链接

在这里插入图片描述

文章目录

【PyTorch】深度学习实战 ——基于主动学习策略处理Mnist分类任务 🐾👀

【PyTorch】深度学习实战 ——基于主动学习策略处理Mnist分类任务 🐾👀

欢迎各位AI爱好者和技术追求者，我是你们的好朋友，猫头虎博主。今天，我们要聊的是一个非常有趣且实用的主题：如何在PyTorch框架下，利用主动学习策略来处理经典的Mnist手写数字分类任务。这不仅是一个深度学习的实战练习，也是我们对主动学习策略在实际问题中应用的一次深入探索。🔍🧠

摘要 📜

在这篇博文中，我们将深入探讨主动学习（Active Learning）的魅力，尤其是在处理有限标注数据情况下的巨大潜力。我们将通过一个具体的实战案例——Mnist手写数字分类任务，来展示如何在PyTorch环境中实施主动学习策略。整个过程将围绕以下几个技术点进行：数据预处理、模型搭建、主动学习循环策略、查询策略实现、以及模型训练与评估。准备好跟着猫头虎博主一起，深入这个AI的奇妙旅程了吗？🚀👾

正文内容 📝

引言 🎤

在深度学习领域，获取大量已标注的数据往往是一件非常耗时且成本高昂的事情。主动学习策略能够帮助我们优化这一过程，通过智能地选择最有价值的数据来进行标注和学习，从而在较少的数据标注成本下，实现模型性能的最大化提升。

主动学习策略概述 📊

主动学习是一种策略，它允许模型主动地从未标注的数据中选择哪些数据进行标注，以便用于进一步的训练。这种方法背后的核心思想是，不是所有的数据都对模型的改善同等重要。通过选择最具信息量的样本来标注和训练，可以更有效率地使用标注的预算，加速模型的学习进程。

实战项目：Mnist手写数字分类任务 🚀

数据预处理 🧹

import torch
from torchvision import datasets, transforms

# 数据预处理：将数据标准化，转化为Tensor格式
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# 下载MNIST数据集
train_set = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_set = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

模型搭建 🛠️

import torch.nn as nn
import torch.nn.functional as F

class MnistModel(nn.Module):
    def __init__(self):
        super(MnistModel, self).__init__()
        self.fc1 = nn.Linear(28*28, 512)
        self.fc2 = nn.Linear(512, 256)
        self.fc3 = nn.Linear(256, 10)

    def forward(self, x):
        x = x.view(-1, 28*28)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return F.log_softmax(x, dim=1)

主动学习循环策略 🔁

初始化：从未标注的数据池中随机选择少量样本进行标注，作为初始训练集。
模型训练：使用当前的训练集对模型进行训练。
数据查询：模型评估未标注的数据，选择最需要被标注的样本（如：最不确定的样本）。
标注更新：将查询阶段选出的样本进行标注，并加入训练集中。
重复步骤2-4，直至满足停止条件或达到预算上限。

查询策略实现 🎯

这里我们采用不确定性采样（Uncertainty Sampling），模型对数据的预测结果越不确定，就越需要被标注。

def uncertainty_sampling(model, data_loader, n_samples):
    model.eval()
    uncertainties = []
    with torch.no_grad():
        for data, _ in data_loader:
            output = model(data)
            prob = F.softmax(output, dim=1)
            uncertainty = -torch.max(prob, dim=1)[0]
            uncertainties.append(uncertainty)
    return uncertainties.argsort(descending=True)[:n_samples]

模型训练与评估 🏋️‍♂️

模型训练和评估的代码实现略，主要包括训练循环、损失计算、优化器步骤和准确率评估。

如何避免常见Bug 🐞

确保数据预处理步骤正确无误，特别是数据标准化时使用的均值和标准差。
在模型搭建时，注意层之间维度的匹配。
在主动学习循环策略中，确保更新的训练集正确合并。

代码案例演示 📼

这部分内容已经在之前的步骤中展示。

QA部分 ❓

Q: 如何选择合适的查询策略？
A: 选择查询策略应考虑问题特性、数据多样性和标注成本。常见的策略包括不确定性采样、查询委员会和预测差异最大化等。

Q: 主动学习在大规模数据集上的应用？
A: 在大规模数据集上，主动学习可以结合迁移学习和小样本学习技术，先利用相似任务的预训练模型，再进行主动学习迭代，以降低计算成本。

表格总结 📊

技术点	说明
数据预处理	标准化，转换为Tensor格式
模型搭建	使用简单的全连接网络
主动学习循环	初始化、训练、查询、更新
查询策略	不确定性采样，选择最需要被标注的样本
避免Bug	数据预处理检查，维度匹配，训练集更新正确性验证

本文总结 🏁

通过本文，我们详细探讨了在PyTorch框架下，使用主动学习策略处理Mnist手写数字分类任务的全过程。我们不仅介绍了主动学习的理论基础和实战应用，还提供了丰富的代码示例和解决常见问题的建议。希望这能帮助大家更好地理解和运用主动学习技术，以更低的成本达到更高的学习效率。

未来行业发展趋势观望 🔮

随着AI技术的不断进步，主动学习作为提高数据效率的关键技术，其重要性将进一步增加。未来，我们可以期待主动学习在半监督学习、无监督学习以及跨领域学习中的应用将更加广泛，同时结合最新的AI技术，如生成对抗网络（GANs）、自监督学习等，开启更多的可能性。

更多最新资讯欢迎点击文末加入领域社群！🎉👥

在这里插入图片描述

👉 更多信息：有任何疑问或者需要进一步探讨的内容，欢迎点击下方文末名片获取更多信息。我是猫头虎博主，期待与您的交流！ 🦉💬

🚀 技术栈推荐：
GoLang, Git, Docker, Kubernetes, CI/CD, Testing, SQL/NoSQL, gRPC, Cloud, Prometheus, ELK Stack

💡 联系与版权声明：

📩 联系方式：

微信: Libin9iOak
公众号: 猫头虎技术团队

⚠️ 版权声明：
本文为原创文章，版权归作者所有。未经许可，禁止转载。更多内容请访问猫头虎的博客首页。

点击下方名片，加入猫头虎领域社群矩阵。一起探索科技的未来，共同成长。

🔗 猫头虎社群 | 🔗 Go语言VIP专栏| 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏

猫头虎-人工智能

关注

8
点赞
踩
27

收藏

觉得还不错? 一键收藏
1
评论
【PyTorch】深度学习实战 ——基于主动学习策略处理Mnist分类任务

在这篇博文中，我们将深入探讨主动学习（Active Learning）的魅力，尤其是在处理有限标注数据情况下的巨大潜力。我们将通过一个具体的实战案例——Mnist手写数字分类任务，来展示如何在PyTorch环境中实施主动学习策略。整个过程将围绕以下几个技术点进行：数据预处理、模型搭建、主动学习循环策略、查询策略实现、以及模型训练与评估。准备好跟着猫头虎博主一起，深入这个AI的奇妙旅程了吗？🚀👾主动学习是一种策略，它允许模型主动地从未标注的数据中选择哪些数据进行标注，以便用于进一步的训练。
复制链接

扫一扫