PyTorch 训练自定义功能齐全的神经网络模型的详细教程

最新推荐文章于 2025-09-19 05:28:39 发布

原创

最新推荐文章于 2025-09-19 05:28:39 发布 · 1.3k 阅读

·

18

·

CC 4.0 BY-SA版权

转载请注明原文链接：https://ntopic.cn

文章标签：

#pytorch #神经网络 #人工智能 #AI

在前面的文章中，老牛同学介绍了不少大语言模型的部署、推理和微调，也通过大模型演示了我们的日常的工作需求场景。我们通过大语言模型，实实在在的感受到了它强大的功能，同时也从中受益颇多。

今天，老牛同学想和大家一起来训练一个自定义的、但是功能齐全的简单的神经网络模型。这个模型虽然在参数规模、训练数据集、应用场景等方面均无法与大语言模型相媲美，但是我们旨在通过这个模型的训练过程，一窥神经网络模型的训练全貌。正所谓“麻雀虽小，五脏俱全”，同时老牛同学也希望能通过本文，与大家一起学习加深对训练神经网络的理解，逐步做到“肚里有货，从容不迫”！

由于模型训练过程的代码可能会反复调试和修改，老牛同学强烈建议大家使用Jupyter Lab来编写和调试代码。如果还没有配置好Jupyter Lab环境，请先移步老牛同学之前的文章，首先完成大模型研发的基础环境配置：大模型应用研发基础环境配置（Miniconda、Python、Jupyter Lab、Ollama 等）

定义神经网络模型

本文重在演示训练过程，因此为了方便我们训练，我们模型定义如下：

它是一个简单的线性计算模型
它只有3 个权重参数
它输出一个数值结果

根据以上定义，我们的模型的线性运算公式定义为：y = W1*x1 + W2*x2 + W3*x3 + b

y 为模型输出，在训练时，则代表模型的目标训练数据集
x 为模型输入，在训练时，则代表模型的输入训练数据集
W 为模型权重，是模型训练的最终结果
b 为调整线性运算结果的偏置向量

我们将根据 y 和 x 训练数据集，逐步训练得出模型权重 W 和 b 值。

本文的源码地址，老牛同学放到评论区。如果大家不想一步一步地跟着老牛同学进行模型训练，也可以直接看源代码，一步到位看完整代码（源代码中还有 1 个权重的样例）。

准备训练数据集

首先，打开 Jupyter Lab 编辑器：

conda activate PY3.12
jupyter-lab .

为了后面创建数据集、创建模型、模型训练等操作，我们直接引入所有的依赖包：

import torch
import torch.nn as nn
import random
import torch.optim as optim
import numpy as np

为了方便构建数据集，我们先假设W的内容（偏置向量b值初始化为0）：

# 随便写几个数字
weights = [1.3, 2.9, 3.7]
w_count = len(weights)

大家可能会有疑问，既然我们都已经知道模型权重了，那我们还训练个啥呢？

别着急，老牛同学提前定义它，有 2 个目的，后面在实际训练时不会使用它：

方便构造我们的训练数据集：因为我们已经确定了模型的线性运算公式，那么我们只需要随机一些x，就可以容易得到训练数据集y了
模型训练结束之后，方便后面做个比对，看下我们训练结果我们预期值是否符合我们预期

我们先构建我们输入数据集，即线性运算公式x的内容，我们通过随机函数构建了 100 个随机数字，并转换模型训练时 PyTorch 张量类型：

x_list = []
for _ in range(100):
    x_list

最低0.47元/天解锁文章

博客等级

码龄19年

109
原创

1723
点赞

2115
收藏

1164
粉丝

关注

私信

热门文章

分类专栏

AI 73篇
Django 1篇
点滴生活 2篇
专业技术 46篇
Dart/Flutter 22篇
Java 13篇
Flex 2篇
数据库 2篇
Maven 4篇
JBPM 1篇
Spring/SpringBoot 3篇
Python 13篇
NoSQL 1篇
消息中间件 1篇
Quartz 1篇

展开全部收起

上一篇：: 太卷了，阿里云免费1个月大模型算力额度，玩转Llama3.1/Qwen2等训练推理

下一篇：: vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程

最新评论

vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程
zen_wx: pip install -v -r requirements-cpu.txt --extra-index-url https://download.pytorch.org/whl/cpu 写错了。应该是 requirements/cpu.txt（即：在requirements目录里的cpu.txt文件）
vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程
zen_wx: 博主写错了。应该是 requirements/cpu.txt（即：在requirements目录里的cpu.txt文件）
Ollama完整教程：本地LLM管理、WebUI对话、Python/Java客户端API应用
程序小丑丷.: org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name 'com.nep.web.Test02': Unsatisfied dependency expressed through field 'ollamaChatClient'; nested exception is org.springframework.beans.factory.NoSuchBeanDefinitionException: No qualifying bean of type 'org.springframework.ai.ollama.OllamaChatClient' available: expected at least 1 bean which qualifies as autowire candidate. Dependency annotations: {@org.springframework.beans.factory.annotation.Autowired(required=true), @org.springframework.beans.factory.annotation.Qualifier("ollamaChatClient")} at org.springframework.beans.factory.annotation.AutowiredAnnotationBeanPostProcessor$AutowiredFieldElement.resolveFieldValue(AutowiredAnnotationBeanPostProcessor.java:659) at org.springframework.beans.factory.annotation.AutowiredAnnotationBeanPostProcessor$AutowiredFieldElement.inject(AutowiredAnnotationBeanPostProcessor.java:639) at org.springframework.beans.factory.annotation.InjectionMetadata.in
基于Qwen2/Lllama3等大模型，部署团队私有化RAG知识库系统的详细教程（Docker+AnythingLLM）
liu3112421: 大佬，给看下，提示这个错误是怎么回事 Failed to save LLM settings: Failed to fetch
ChatTTS 长音频合成和本地部署2种方式，让你的“儿童绘本”发声的实战教程（文末有福利）
qq_45685574: 删除文中的第二步

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。