机器学习中的神经网络入门

最新推荐文章于 2024-10-02 16:36:44 发布

baorant在写代码

最新推荐文章于 2024-10-02 16:36:44 发布

阅读量330

点赞数 1

分类专栏：机器学习文章标签：机器学习神经网络人工智能

本文链接：https://blog.csdn.net/weixin_39033300/article/details/139777246

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

机器学习中的神经网络是一种模拟人脑神经元结构的计算模型，广泛应用于分类、回归、图像识别、自然语言处理等领域。神经网络由多个层（输入层、隐藏层和输出层）组成，每层包含若干神经元（节点），这些神经元通过权重连接。
神经网络的基本概念
神经元（Neuron）：基本计算单元，接收输入信号并通过激活函数产生输出。
层（Layer）：神经元的集合，包括输入层、隐藏层和输出层。
权重（Weight）：连接神经元的参数，决定输入信号的影响力。
偏置（Bias）：额外参数，帮助模型更好地拟合数据。
激活函数（Activation Function）：非线性函数，决定神经元的输出，如ReLU、Sigmoid、Tanh等。
损失函数（Loss Function）：衡量模型预测与真实值的差异，如均方误差、交叉熵等。
优化器（Optimizer）：用于调整权重和偏置以最小化损失函数，如梯度下降、Adam等。
神经网络的工作流程
前向传播（Forward Propagation）：输入数据通过各层神经元的计算，产生输出。
损失计算（Loss Calculation）：使用损失函数计算预测值与真实值之间的差异。
反向传播（Backward Propagation）：通过链式法则计算损失函数对各参数的梯度，更新权重和偏置。
参数更新（Parameter Update）：使用优化器根据梯度调整权重和偏置。
实现神经网络的步骤
以下是使用TensorFlow/Keras和PyTorch实现神经网络的示例。

使用TensorFlow/Keras

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layer
# 准备数据
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

data = load_iris()
X = data.data
y = data.target

# 数据分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 数据标准化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 构建模型
model = Sequential([
    Dense(64, activation='relu', input_shape=(X_train.shape[1],)),
    Dense(64, activation='relu'),
    Dense(3, activation='softmax')  # 3分类问题
])

# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']

# 训练模型
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_split=0.2)

# 评估模型
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Test Accuracy: {accuracy}')

使用PyTorch

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset

# 准备数据
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScal

data = load_iris()
X = data.data
y = data.target

# 数据分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 数据标准化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 转换数据为Tensor
X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train, dtype=torch.long)
y_test_tensor = torch.tensor(y_test, dtype=torch.long)

# 创建数据加载器
train_dataset = TensorDataset(X_train_tensor, y_train_tensor)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

# 构建模型
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.layer1 = nn.Linear(4, 64)
        self.layer2 = nn.Linear(64, 64)
        self.output = nn.Linear(64, 3)  # 3分类问题
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.relu(self.layer1(x))
        x = self.relu(self.layer2(x))
        x = self.output(x)
        return x
        
model = NeuralNetwork()

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
for epoch in range(50):
    for batch_X, batch_y in train_loader:
        optimizer.zero_grad()
        outputs = model(batch_X)
        loss = criterion(outputs, batch_y)
        loss.backward()
        optimizer.step()

# 评估模型
with torch.no_grad():
    outputs = model(X_test_tensor)
    _, predicted = torch.max(outputs, 1)
    accuracy = (predicted == y_test_tensor).sum().item() / y_test_tensor.size(0)
    print(f'Test Accuracy: {accuracy}')

进一步优化和扩展
超参数调优：调整学习率、批量大小、网络结构等超参数。
正则化：使用L1/L2正则化、Dropout等技术防止过拟合。
数据增强：通过数据增强技术增加训练数据的多样性。
迁移学习：使用预训练模型进行迁移学习，提高模型性能。
模型集成：组合多个模型的预测结果，提升整体性能。
通过这些步骤和技术，你可以构建、训练和优化神经网络模型，以解决各种实际问题。