AI菜鸟向前飞 — 基础知识篇

最新推荐文章于 2025-05-14 14:43:48 发布

Song榆钱儿

最新推荐文章于 2025-05-14 14:43:48 发布

阅读量353

点赞数 9

分类专栏： AI菜鸟向前飞文章标签：人工智能 gpt aigc

本文链接：https://blog.csdn.net/soukingang/article/details/138810292

版权

前言

主要介绍最最基础的知识，在这个基础上有现在比较流行的GPT、Llama、Gemini等一系列大模型的出现，打好基础才能更理解上面是如何运作以及实现的过程。

PS：本篇科普不会介绍梯度下降算法（偏导数）等复杂的过程，先只会点到为止。

生命周期

建模（Modeling）

建模是设计深度学习模型的过程，包括选择适当的网络架构。

在此阶段，你需要确定的网络层数，每层的节点数、激活函数类型、优化器以及损失函数等。

训练（Training）

训练阶段是深度学习模型学习并优化权重的过程。

在此阶段，模型通过一组已标记的训练数据进行学习。这个过程在训练数据集上反复运行，直到模型的性能达到满意的程度或者达到预定的迭代次数，其中包含：有监督学习、无监督学习、半监督学习。

验证（Validation）

验证阶段通常在训练过程中进行，其目的是评估模型对未见过的数据的泛化能力。

在此阶段，模型在一个独立的，非训练数据集（验证集）上进行测试。验证过程帮助我们调整模型参数，并决定何时停止训练。

推理（Inference）

推理阶段是模型部署后的阶段，也就是模型在实际环境中作出预测的阶段。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Song榆钱儿

关注关注

9
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

AI菜鸟向前飞 — LangChain系列之十三 - 关于Tool的必知必会

Song榆钱儿的博客

05-21

852

本文介绍LangChain的一个重要知识点Tool，以及它的三种实现方式，还有它是如何与大语言模型联动使用的

【人工智能】Java接入deepseek亲测有效

JAVA领域优质创作者，基于分片网络查询方法专利发明者。

02-10

3929

* 出于与 OpenAI 兼容考虑，您也可以将 base_url 设置为 https://api.deepseek.com/v1 来使用，但注意，此处 v1 与模型版本无关。 * deepseek-chat 模型已全面升级为 DeepSeek-V3，接口不变。通过指定 model='deepseek-chat' 即可调用 DeepSeek-V3。 * deepseek-reasoner 是 DeepSeek 最新推出的推理模型 DeepSeek-R1。通过指定 model='deepseek-reas

参与评论您还未登录，请先登录后发表或查看评论

AI菜鸟向前飞 — 大模型基础知识篇

2401_82469710的博客

05-11

869

主要介绍最最基础的知识，在这个基础上有现在比较流行的GPT、Llama、Gemini**等一系列大模型的出现，打好基础才能更理解上面是如何运作以及实现的过程。

菜鸟学Python | ChatGPT的工作原理，这篇文章说清楚了！（下）

csdn_xmj的博客

02-24

890

ChatGPT 能够自动生成一些读起来表面上甚至像人写的文字的东西，这非常了不起，而且出乎意料。但它是如何做到的？为什么它能发挥作用？我在这里的目的是大致介绍一下 ChatGPT 内部的情况，然后探讨一下为什么它能很好地生成我们认为是有意义的文本。

大数据人工智能领域从菜鸟到高手晋级指南

weixin_33779515的博客

11-21

134

我们身处一个“技术爆炸”和“共享、开源”的时代，先进技术的更新迭代速率超过了历史上任何一个时期，而且这些技术也不再闭塞，人人都可以接触并学习。终身学习已经是我们每个人不得不面对的问题，这一点在大数据/人工智能领域体现的尤为明显：层出不穷的新技术，一方面为我们带来了便利，但同时也使我们面临难以高效学习和选择的窘境。因此，在这样的时代背景下学习大数据知识，需...

C学习笔记 基础知识整合（2024 9.19-10.7）

m0_59778421的博客

09-27

1270

C语言学习笔记

独家 | 大数据人工智能领域从菜鸟到高手晋级指南

THU数据派

11-12

4300

作者：王明哲、王存光校对：丁楠雅本文长度为5600字，建议阅读10分钟本文为你剖析当下的时代背景，为在大数据江湖中修炼的行者提供升级建议。我们身处一个“技术爆炸”和“共享、开源”的时代，先进技术的更新迭代速率超过了历史上任何一个时期，而且这些技术也不再闭塞，人人都可以接触并学习。终身学习已经是我们每个人不得不面对的问题，这一点在大数据/人工智能领域体现的尤为明显：层出不穷的

干货 | 大数据人工智能领域从菜鸟到高手晋级指南

AI科技大本营

11-19

1388

作者 | 王明哲、王存光校对 | 丁楠雅本文长度为5600字，建议阅读10分钟本文为你剖析当下的时代背景，为在大数据江湖中修炼的行者提供升级建议。我们身处一个“技术爆炸”和“共享、开源”的时代，先进技术的更新迭代速率超过了历史上任何一个时期，而且这些技术也不再闭塞，人人都可以接触并学习。终身学习已经是我们每个人不得不面对的

无痛入门强化学习，零基础到Flappy_bird实战

sc909090的博客

07-28

979

这里大概讲解了一下关于强化学习的一些基本知识，以及简单的实践，实际上强化学习还有很多东西，我自己也没有学的很明白，这里主要是做一个学习笔记，以及分享一些经过我理解过后的知识，希望可以给大家提供一点帮助，后面可能会写一篇关于策略梯度和ppo的文章，有空再看吧。

一篇搞定，Kettle详细教程

Aidon博客

09-21

8258

本文主要以Kettle概述、Kettle开发环境部署、mac m1 kettle安装、linux kettle安装、kettle集群安装部署、kettle输入、kettle输出、kettle转换、kettle批量加载、kettle流程、kettle脚本、kettle的Java代码案例、kettle查询控件、kettle连接控件、kettle映射控件、kettle统计控件、kettle应用、kettle整合大数据、kettle streaming控件、kettle作业、kettle调度、kettle变量和参数

无人驾驶智能车竞速赛,智能大会无人驾驶比赛

神经网络爱好者

07-26

2185

目前，国内影响力最大的机器人竞赛是原中国机器人大赛暨RoboCup中国公开赛。该项赛事从1999年开始到2015年，一共举办了17届。从2016年开始，根据中国自动化学会对机器人竞赛管理工作的要求，原中国机器人大赛暨RoboCup中国公开赛中RoboCup比赛项目和RoboCup青少年比赛项目合并在一起，举办RoboCup机器人世界杯中国赛（RoboCupChinaOpen）。原中国机器人大赛暨RoboCup中国公开赛中非RoboCup项目继续举办中国机器人大赛。...

LangChain 概述LangChain 是一个开源的大型语言模型（LLM）应用开发框架，旨在通过模块化组件和工具链，帮助开发者高效构建端到端的 AI 应用。

lovejava20100324的博客

02-13

887

LangChain 是一个开源的。

【datawhale组队学习】coze-ai-assistant TASK01

m0_52024881的博客

05-13

617

通过扣子开发的 AI 应用有明确的输入和输出，可以根据既定的业务逻辑和流程完成一系列简单或复杂的任务，例如 AI 搜索、翻译工具、饮食记录等。工作流具备了：大量的重复性任务（如内容创作、编辑、发布）和固定的业务流程（如策划、创作、审核、发布）。的 AI 项目，它通过对话方式接收用户的输入，由大模型自动调用插件或工作流等方式执行用户指定的业务流程，并生成最终的回复。教程：Coze / 扣子（飞书文档）10. 教程：Coze / 扣子。4万字教程-COZE/扣子与智能体入门（飞书文档）

Recraft.ai：赋能专业设计师的 AI 创意引擎

weixin_44903776的博客

05-12

1195

Recraft.ai 是一款专为专业设计师打造的 AI 创意引擎，集图像生成、编辑、矢量化、协作于一体，旨在提升设计效率与创意表达。其核心功能包括 AI 图像生成器、矢量生成器、照片编辑器等，支持风格一致性与品牌化，适用于 Logo 设计、图标制作、广告素材等多个场景。Recraft.ai 强调“设计师主导”理念，提供完全掌控、高效协作与简化工作流程的优势，帮助设计师节省时间并提升作品质量。目前提供免费试用，适合设计师与设计爱好者探索 AI 创意的无限可能。

第二十一天打卡

nbbsn的博客

05-11

783

这个结果略微差于聚类后的效果，但和一开始考虑所有特征的预测效果差不多，这个降维算法也比较成功。首先我们要对训练集和测试集进行处理，将非数字部分进行编码，并且将空缺值进行填充。- 输出每个模型的最佳参数和评估指标（准确率、精确率、召回率和F1分数）- 对每个模型分别使用网格搜索和贝叶斯优化进行超参数调优。这里可以看出预测结果大大提高了，这个调整工程是成功的。- 使用三个典型模型：随机森林、支持向量机和逻辑回归。- 在验证集上评估每个模型的性能。

Baklib智能云平台加速企业数据治理

weixin_51374429的博客

05-13

967

Baklib智能云平台通过一站式数字资源管理、知识库构建及多场景内容系统搭建，实现企业图文音视频全资产统一存储与智能分类，结合AI驱动的高效数据预处理能力，显著提升知识沉淀效率和治理规范性，助力客户服务、内部协作与数字资产价值释放。

Python数据分析案例74——基于内容的深度学习推荐系统（电影推荐）

weixin_46277779的博客

05-10

1428

【AI】“CUDA” 到底是什么？（AI 计算民主化，第二部分）