【TensorFlow与PyTorch：构建现代深度学习模型的两大支柱】

最新推荐文章于 2025-03-10 21:52:27 发布

是阿牛啊

最新推荐文章于 2025-03-10 21:52:27 发布

阅读量454

点赞数 7

分类专栏：大数据挖掘数据分析机器学习回归预测文章标签： dnn 算法随机森林机器学习回归人工智能 pytorch

本文链接：https://blog.csdn.net/weixin_51352614/article/details/139246846

版权

大数据挖掘同时被 3 个专栏收录

85 篇文章

订阅专栏

数据分析

62 篇文章

订阅专栏

机器学习回归预测

44 篇文章

订阅专栏

文章目录

前言

前言

进入深度学习世界的学习者和研究人员很快会遇到两个极具影响力的框架：TensorFlow和PyTorch。它们都提供了强大的工具和库，使得构建和训练复杂的深度学习模型变得可行和高效。在这篇博客中，我们将介绍这两个框架的核心特点，并通过一个简单的神经网络示例，展示它们在实际使用中的代码结构。无论你是初学者还是有经验的开发者，都可以通过这篇文章更好地理解如何使用这些工具来构建你的模型。

TensorFlow与PyTorch的比较

TensorFlow 是由Google开发的一个开源框架，广泛应用于生产和研究领域。它以其高性能和可伸缩性而闻名，特别适合处理大型数据集。
PyTorch 是由Facebook的AI研究团队开发的。它以易用性和动态计算图著称，特别受教育界和研究者的青睐。

虽然两个框架在设计哲学和API上有所不同，但它们都支持自动微分，GPU加速，以及丰富的库和社区资源。

神经网络示例：手写数字识别

为了让你对TensorFlow和PyTorch的使用有个直观理解，我们将通过构建一个简单的用于手写数字识别（MNIST数据集）的神经网络模型来展示。

TensorFlow伪代码：

import tensorflow as tf

# 加载数据集
mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# 构建模型
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 训练模型
model.fit(train_images, train_labels, epochs=5)

# 评估模型
model.evaluate(test_images, test_labels)

PyTorch伪代码：

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms

# 加载数据集
train_loader = torch.utils.data.DataLoader(
  datasets.MNIST('.', train=True, download=True,
                 transform=transforms.Compose([
                     transforms.ToTensor(),
                     transforms.Normalize((0.1307,), (0.3081,))
                 ])),
  batch_size=64, shuffle=True)

test_loader = torch.utils.data.DataLoader(
  datasets.MNIST('.', train=False, transform=transforms.Compose([
                     transforms.ToTensor(),
                     transforms.Normalize((0.1307,), (0.3081,))
                 ])),
  batch_size=1000, shuffle=True)

# 构建模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(28*28, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = x.view(-1, 28*28)
        x = torch.relu(self.fc1(x))
        x = torch.dropout(x, p=0.2, train=self.training)
        x = self.fc2(x)
        return torch.log_softmax(x, dim=1)

model = Net()

# 编译模型
optimizer = optim.Adam(model.parameters())
criterion = nn.CrossEntropyLoss()

# 训练模型
for epoch in range(5):
    for batch_idx, (data, target) in enumerate(train_loader):
        optimizer.zero_grad()
        output = model(data)
        loss = criterion(output, target)
        loss.backward()
        optimizer.step()

# 评估模型
with torch.no_grad():
    for data, target in test_loader:
        output = model(data)
        test_loss = criterion(output, target)