大白话 AI 答疑
文章平均质量分 81
*星星之火*
从菜鸟到专家,陪同大家一起成长
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【大白话 AI 答疑】第10篇 数学可视化网站汇总
本文推荐两个实用的在线学习工具:GeoGebra(https://www.geogebra.org/)提供数学公式可视化功能,其经典版(https://www.geogebra.org/classic)可直观展示函数图形;TensorFlow Playground(https://playground.tensorflow.org/)通过交互式界面帮助用户理解神经网络原理。这两个平台分别适用于数学学习和AI入门,通过可视化方式降低学习难度。原创 2025-12-26 21:43:35 · 223 阅读 · 0 评论 -
【大白话 AI 答疑】第9篇 深入浅出:sigmoid函数公式设计原理——为何是$e^{-x}$而非$e^x$
本文深入解析了sigmoid函数公式$\frac{1}{1+e^{-x}}$的设计原理。该函数将任意实数输入映射到(0,1)区间,适合二分类任务。选用$e^{-x}$而非$e^x$的关键在于:1)保证单调递增性,使输入越大输出概率越高;2)简化导数计算,便于反向传播。公式设计巧妙结合了数学特性和任务需求,虽然后续ReLU等函数更常用,但理解sigmoid原理对掌握激活函数设计思想至关重要。原创 2025-12-20 18:00:15 · 1040 阅读 · 0 评论 -
【大白话 AI 答疑】第8篇 BERT与传统机器学习(如贝叶斯)在文本分类中的区别及效果对比
核心结论:。原创 2025-12-20 17:28:02 · 1079 阅读 · 0 评论 -
【大白话 AI 答疑】 第7篇熵、交叉熵与交叉熵损失的概念梳理及计算示例
熵是信息论中的核心概念,由香农(Shannon)提出,用于衡量一个随机变量取值的不确定性程度。简单来说,熵值越高,随机变量的不确定性就越大;熵值越低,不确定性就越小。当随机变量的取值确定无疑时(比如必然发生的事件),熵值为0;当随机变量所有取值的概率均等时,熵值达到最大。对于离散型随机变量X,其可能的取值为x₁, x₂, …, xₙ,对应的概率分布为P(X=xᵢ) = pᵢ(其中i=1,2,…原创 2025-12-20 10:48:38 · 1110 阅读 · 0 评论 -
【大白话 AI 答疑】第6篇 大模型指令微调:instruction/input/output核心解析及案例
instruction(指令):核心是“任务描述”,用于明确告知模型需要完成的具体工作,比如“翻译”“总结”“分析情绪”等,是模型理解任务目标的关键。input(输入):可理解为“任务素材”,是模型执行任务的直接对象,仅当任务需要具体载体时存在(部分简单任务如“解释什么是AI”可无input),是指令落地的核心依据。output(输出):即“预期结果”,是模型完成任务后应生成的标准答案,用于指导模型学习“指令+输入”与“正确结果”之间的映射关系,是微调的监督信号。告诉模型“做什么”,input。原创 2025-12-05 16:40:03 · 1182 阅读 · 0 评论 -
【大白话 AI 答疑】第5篇 从 “窄域专精” 到 “广谱通用”:传统机器学习与大模型的 6 大核心区别
传统机器学习是“针对具体问题的精准工具”——像一把专门用来切菜的刀,高效但用途单一;大模型是“具备多种能力的通用平台”——像一个多功能工具箱,虽然单个工具的精度可能不如专用工具,但能应对砍、锯、拧等多种场景,且能快速适配新需求。二者并非“替代关系”:在需要高精度、低成本、边缘部署的中小规模任务中,传统机器学习仍是最优选择;而在需要通用能力、跨任务适配、复杂场景处理的需求中,大模型才体现出不可替代的价值。原创 2025-12-01 17:12:33 · 1134 阅读 · 0 评论 -
【大白话 AI 答疑】第4篇 自回归模型与传统机器学习模型的对比
自回归模型与传统机器学习模型在建模目标、数据处理和能力边界上存在根本差异。自回归模型(如GPT)专注于序列生成,依赖无标注海量数据,通过自监督学习捕捉时序依赖,具备通用生成和跨任务泛化能力,输出开放域动态序列。传统模型(如逻辑回归、CNN)则针对特定任务,需结构化标注数据,缺乏时序感知和生成能力,输出封闭域固定结果。自回归模型代表从“被动预测”到“主动生成”的范式跃迁,核心是创造内容而非简单任务拟合。原创 2025-12-01 11:27:21 · 1084 阅读 · 0 评论 -
【大白话 AI 答疑】第3篇 面试必背:自回归模型定义 + GPT 的自回归特性(附对比表)
自回归模型是基于历史信息逐元素生成序列的模型,核心特点是时序依赖和串行生成。GPT是典型的自回归模型,采用Transformer解码器架构,通过掩码自注意力机制确保生成每个token时仅依赖前面内容。与非自回归模型相比,GPT生成更连贯但速度较慢。这种设计使GPT能生成逻辑清晰的长文本,成为优秀对话和创作模型的基础。原创 2025-12-01 11:18:16 · 944 阅读 · 0 评论 -
【大白话 AI 答疑】第2篇 GPT 全系列发展历程:从 GPT-1 到 GPT-5,每一代的关键突破都在这!
GPT系列从1到5的发展历程展现了AI技术的快速突破。2018年的GPT-1验证了Transformer架构的可行性;2019年GPT-2通过15亿参数实现零样本学习;2020年GPT-3以1750亿参数实现上下文学习;2022年GPT-3.5引入强化学习优化对话体验;2023年GPT-4支持多模态输入和复杂推理;2025年即将发布的GPT-5将实现自主进化,能独立完成复杂任务。每一代都在参数量、训练数据和核心能力上实现突破,推动AI从基础模型向通用智能发展。原创 2025-12-01 10:47:25 · 612 阅读 · 0 评论 -
【大白话 AI 答疑】第1篇 面试必问:RNN、CNN 和大模型的本质区别到底在哪?
RNN/CNN是针对特定数据类型(序列/空间)的专用工具,解决“单一模态、单一任务”问题;大模型是面向通用任务的基础系统,通过“海量数据+强大架构”实现跨模态、跨任务的泛化能力,本质是从“专用模型”到“通用智能”的范式跃迁。原创 2025-12-01 10:36:18 · 353 阅读 · 0 评论
分享