表面：训练模型实际：反向传播训练自己

最新推荐文章于 2025-05-07 08:37:23 发布

feifeikon

最新推荐文章于 2025-05-07 08:37:23 发布

阅读量103

点赞数 2

文章标签：自然语言处理深度学习 transformer 人工智能 bert

本文链接：https://blog.csdn.net/feifeikon/article/details/145408735

版权

用优质的八股文和 CSDN 文章来反向传播训练自己，用面试和刷题来调整损失函数，用实际的面试场景作为环境，用 HR 和面试官的反馈作为奖励信号，用不断尝试不同的回答策略进行探索和利用，用最终的 offer 作为强化学习的回报，持续优化自己的策略，直至收敛到最佳求职策略。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

feifeikon

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PSPNet的预训练模型：如何使用预训练模型

AGI×大数据，开启智能时代的认知跃迁；解码AGI，赋能数据驱动的智能革命。

06-08

282

PSPNet的预训练模型：如何使用预训练模型 1. 背景介绍 1.1 语义分割任务概述语义分割是计算机视觉领域的一项重要任务,旨在将图像中的每个像素分类到预定义的类别中。它在自动驾驶、医学图像分析、遥感图像解译等领域有广泛应

深入学习——深入解析：PyTorch模型训练的过程与技术挑战

weixin_43199439的博客

03-22

PyTorch的训练流程基于损失函数优化、梯度下降和自动微分，形成了一个相对成熟的训练框架。然而，面对现代神经网络模型日益增加的复杂性，依然存在计算资源瓶颈、梯度问题和优化难度等挑战。为了进一步提高模型训练的效率和稳定性，我们需要借助分布式训练、优化算法的多样化、正则化技术等手段进行优化。未来，随着硬件加速、算法改进和理论发展，我们可以期待在训练速度、模型精度和泛化能力等方面取得更大突破。NAS有潜力带来更高效、更优的网络架构。

参与评论您还未登录，请先登录后发表或查看评论

大模型训练全解析：预训练、微调、强化学习，一步到位！

python12345678_的博客

03-18

994

2025年初，随着DeepSeek的迅速走红，公众对LLM（大语言模型）的兴趣急剧上升。许多人被LLM展现出的近乎魔法的能力所吸引。然而，这些看似神奇的模型背后究竟隐藏着什么秘密？接下来，我们将深入探讨LLM的构建、训练和微调过程，揭示它们如何从基础模型演变为我们今天所使用的强大AI系统。这篇文章是我一直想写的，如果你有时间，它绝对值得一读。：我们将介绍LLM的基础知识，涵盖从预训练到后训练的整个过程，探讨神经网络的工作原理、幻觉现象（Hallucinations）以及模型的推理机制。

万字长文，YOLO 模型训练提升指南：快速掌握核心技巧 | 基础篇

YOLOv8项目贡献者

11-21

4147

万字长文，YOLO 模型训练提升指南：快速掌握核心技巧 | 基础篇

论文导读：万卡集群训练大模型（by字节跳动）

渡江客涂鸦板

03-05

8853

字节跳动提出了万卡集群大模型训练架构MegaScale，并在12288个GPU上训练一个175B LLM模型时，用MegaScale实现了55.2%的MFU，比Megatron-LM提高了1.34倍；提供了万卡集群训练大模型的踩坑经验；证实了强大完备的训练基础设施（包含各种各样的诊断工具、监测工具、可视化工具等）对高效、稳定训练LLM至关重要；

【LLM】3：从零开始训练大语言模型（预训练PT、微调SFT、RLHF）

zzZ_CMing的博客

11-07

2384

奖励函数用于评估生成模型的输出质量。将输入文本和生成的响应传递给奖励模型，得到分数并作为奖励信号返回。

揭秘分布式训练与微调技巧：语言大模型的高效训练与优化指南

2401_85325726的博客

09-02

1947

综上所述，以下是尝试在1000万以上规模的数据集上对10-100B+模型参数进行实验和微调的实用指南（我有DeepSpeed的经验，尚未使用FSDP，所以我将重点放在这上面）：默认情况下使用BF16/ FP16。BF16基本不需要其他配置参数，通常不会出现任何溢出问题（相反，FP16可能会因不同的损失扩展因子导致不同的结果，并且由于动态范围较小，可能出现更多的溢出问题），因此非常方便。使用LoRA，并将可训练参数添加到所有线性层。如果你想紧密遵循QLoRA，可在这里（）使用他们的实用函数。

使用自己的数据集创建神经网络训练模型，一篇博客就够了。

热门推荐

weixin_43974748的博客

04-28

2万+

使用Tensorflow创建自己的数据集，并训练自学入坑，尝试着写博客记录自己的学习过程，希望对其他人也有帮助介绍环境 win10 + pycharm 介绍背景小弟是某高校农业电气自动化学生，导师要求用卷积神经网络对不同水分的玉米进行分类（最后的目标是实现回归）话不多说直接上代码 step1：建立两个TFrecords # pycharm中此模块名为genertateds.py imp...

全景解读 LLM Posting-Train（后训练）技术

AI前沿技术的分享！

03-27

1234

后训练技术的核心价值体现在三个维度：知识精炼：修正预训练阶段的知识偏差与事实错误能力对齐：使模型输出符合人类价值观和任务需求推理增强：赋予模型多步推理、逻辑验证等高级认知能力

大语言模型(LLM)综述(三)：大语言模型预训练的进展

qq_51957239的博客

10-24

2401

随着人工智能和机器学习领域的迅速发展，语言模型已经从简单的词袋模型（Bag-of-Words）和N-gram模型演变为更为复杂和强大的神经网络模型。在这一进程中，大型语言模型（LLM）尤为引人注目，它们不仅在自然语言处理（NLP）任务中表现出色，而且在各种跨领域应用中也展示了惊人的潜力。从生成文本和对话系统到更为复杂的任务，如文本摘要、机器翻译和情感分析，LLM正在逐渐改变我们与数字世界的互动方式。然而，随着模型规模的增加，也出现了一系列挑战和问题，包括但不限于计算复杂性、数据偏见以及模型可解释性。

钢材表面缺陷数据，训练、验证、测试

09-23

在IT行业中，尤其是在计算机视觉领域，数据集是训练模型的基础，而"钢材表面缺陷数据，训练、验证、测试"这个标题暗示了一个专用于识别钢材表面缺陷的图像数据集。这样的数据集通常包含了大量的图片，每张图片都展示...

BERT预训练

weixin_73557167的博客

05-06

876

BERT预训练

多模态大语言模型arxiv论文略读（五十三）

Jamence的博客

05-01

936

实验设计了多种越狱方法，包括文本越狱和视觉越狱，以全面评估模型对越狱攻击的鲁棒性。研究发现，GPT-4和GPT-4V在文本和视觉越狱方法上表现出更好的鲁棒性，而Llama2和Qwen-VL-Chat在开源模型中表现更为稳健。实验结果表明，VTPrompt显著提高了GPT-4V和Gemini Pro在这些任务中的性能，特别是在MME和MMB数据集上，分别取得了显著的分数提升。实验结果表明，VoT显著提高了模型在所有任务中的表现，尤其是在自然语言导航任务中，VoT比禁用可视化的设置提高了23.5%的性能。

【NLP】33. Pinecone + OpenAI ：构建自定义语义搜索系统

weixin_48846514的博客

05-05

381

{"id": "doc1", "text": "老虎是一种主要生活在亚洲的肉食动物"},{"id": "doc2", "text": "大象是陆地上最大的动物，有长鼻和大耳朵"},{"id": "doc3", "text": "保龄羊是生活在欧洲高原的羊类动物"},{"id": "doc4", "text": "老鼠是一种常见小型动物，有很强的生存力"}

多模态大语言模型arxiv论文略读（五十二）

Jamence的博客

05-01

892

➡️ 问题背景：大型语言模型（LLMs）及其多模态版本（MLLMs）的发展为游戏代理（game agents）的进化提供了前所未有的机会，使这些代理能够在复杂的计算机游戏环境中展现出类似人类的决策能力。➡️ 研究动机：为了弥合这一差距，研究团队对基于LLM的游戏代理（LLMGAs）进行了全面的综述，旨在提供一个统一的参考框架，涵盖LLMGAs的六个核心功能组件：感知、记忆、思考、角色扮演、行动和学习。➡️ 研究动机：为了填补3D医学图像分析的空白，研究团队致力于开发适用于3D医学图像的多模态大语言模型。

【自然语言处理与大模型】使用Xtuner进行QLoRA微调实操

qq_39780701的博客

05-02

1367

手把手演示如何使用Xtuner对模型进行微调训练，包括数据准备、训练命令执行及训练过程中的监控技巧。最后，在完成微调之后，本文还将介绍如何对微调结果进行简单对话测试。

多模态大语言模型arxiv论文略读（六十三）

表面：训练模型 实际：反向传播训练自己

表面：训练模型实际：反向传播训练自己