机器学习相关术语

最新推荐文章于 2024-05-14 15:30:00 发布

易之阴阳

最新推荐文章于 2024-05-14 15:30:00 发布

阅读量308

点赞数 5

分类专栏：机器学习深度学习人工智能文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuzk423/article/details/138321481

版权

人工智能同时被 3 个专栏收录

122 篇文章 0 订阅

订阅专栏

90 篇文章 0 订阅

订阅专栏

75 篇文章 0 订阅

订阅专栏

机器学习作为人工智能的一个核心分支，涉及众多专业术语。以下是机器学习领域中一些基础且重要的术语及其解释：

Data (数据)：机器学习模型训练和测试所使用的原始信息记录，可以是数字、文本、图像等形式。
Dataset (数据集)：一组收集好的数据记录，通常用于训练机器学习模型或评估其性能。
Instance/Sample (实例/样本)：数据集中的一条记录，代表一个具体观测或事件。
Feature/Attribute (特征/属性)：描述实例的属性或变量，用于区分不同实例，是模型做决策的基础。
Label (标签)：在监督学习中，每个样本对应的正确答案或目标变量，用于训练模型进行预测。
Supervised Learning (监督学习)：模型在带有标签的训练数据上学习输入与输出之间的映射关系。
Unsupervised Learning (无监督学习)：模型在无标签数据上学习数据的内在结构或模式。
Regression (回归)：一种监督学习任务，预测连续数值型的目标变量。
Classification (分类)：一种监督学习任务，预测离散类别型的目标变量。
Model (模型)：机器学习中用于进行预测或决策的数学表示或算法结构。
Training (训练)：使用数据集来调整模型参数，以最小化预测误差或最大化模型性能的过程。
Hyperparameter (超参数)：在模型训练开始之前设定的参数，如学习率、隐藏层大小等，影响模型的学习过程但不在训练过程中自动更新。
Loss Function (损失函数)：衡量模型预测值与真实值之间差异的函数，训练过程中力求最小化该函数值。
Overfitting (过拟合)：模型在训练数据上表现过好，以至于不能很好地泛化到未见过的数据。
Underfitting (欠拟合)：模型过于简单，不能充分捕捉数据中的模式，导致训练数据和测试数据上的表现都不佳。
Cross-Validation (交叉验证)：一种评估模型性能的方法，通过将数据分成训练集和验证集的不同组合来测试模型的泛化能力。
Regularization (正则化)：在损失函数中加入额外项以防止模型过拟合，常见的有L1和L2正则化。
Ensemble Learning (集成学习)：结合多个模型的预测以提高整体预测准确性和稳定性，如Bagging、Boosting和Stacking。
Gradient Descent (梯度下降)：一种常用的优化算法，用于寻找损失函数最小值，通过沿着梯度的反方向逐步调整模型参数。
Neural Network (神经网络)：一种模拟人脑神经元结构的计算模型，由多层节点（神经元）组成，广泛应用于深度学习。

这些术语构建了机器学习的基础框架，理解它们有助于深入学习和应用机器学习技术。

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
机器学习相关术语

在模型训练开始之前设定的参数，如学习率、隐藏层大小等，影响模型的学习过程但不在训练过程中自动更新。：一种评估模型性能的方法，通过将数据分成训练集和验证集的不同组合来测试模型的泛化能力。：一种常用的优化算法，用于寻找损失函数最小值，通过沿着梯度的反方向逐步调整模型参数。：模型过于简单，不能充分捕捉数据中的模式，导致训练数据和测试数据上的表现都不佳。：在监督学习中，每个样本对应的正确答案或目标变量，用于训练模型进行预测。：描述实例的属性或变量，用于区分不同实例，是模型做决策的基础。
复制链接

扫一扫

专栏目录

易之阴阳 CSDN认证博客专家 CSDN认证企业博客

码龄15年

290: 原创

7634: 周排名

7854: 总排名

12万+: 访问

: 等级

5359: 积分

1901: 粉丝

2355: 获赞

36: 评论

1521: 收藏

私信

关注

热门文章

分类专栏

最新评论

人工智能技术中的多模态融合（Multimodal Fusion）
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
多模态对话系统的人工智能技术特点
2401_84557161: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PyTorch 机器学习中的神经网络算法人脸识别模型定义、训练和应用
易之阴阳: https://blog.csdn.net/liuzk423/article/details/138664752
PyTorch 机器学习中的神经网络算法人脸识别模型定义、训练和应用
k丿k: 在得到anchor,positive和negative之后，只需要在计算损失部分把所需的参数改成这三个就行了吗？
PyTorch 机器学习中的神经网络算法人脸识别模型定义、训练和应用
易之阴阳: 使用三元组损失函数时，关键在于如何恰当地选取`anchor`、`positive`和`negative`这三个样本。下面是具体的操作步骤和建议： 1. 定义样本： - Anchor (A)：这是你要定位或学习的样本，通常是一个特征向量，比如一个人脸图像的嵌入向量。 - Positive (P)：这是与Anchor属于同一类别的另一个样本的特征向量。例如，在人脸识别任务中，如果Anchor是一个人的图像，那么Positive可以是同一个人的另一张图像的特征向量。 - Negative (N)：这是与Anchor不属于同一类别的样本的特征向量。在上述人脸识别的例子中，Negative可以是另一个人的图像特征向量。 2. 计算距离： - 你需要计算Anchor与Positive之间的距离 \(d(A, P)\)，以及Anchor与Negative之间的距离 \(d(A, N)\)。常见的距离度量有欧氏距离、余弦相似度或者是经过特定变换后的距离，如在FaceNet中使用的L2归一化后的距离。 3. 确定边界值（margin）： - 选择一个合适的边界值（\(margin\)），这个值决定了Positive和Negative样本在嵌入空间中需要拉开的最小差距。常见的初始设置可能是1.0，但实际值应根据任务和数据特性调整。 4. 计算损失： - 使用公式 \(L = \max(0, margin + d(A, P) - d(A, N))\) 计算三元组损失。如果 \(d(A, P) - d(A, N)\) 小于 \(margin\)，则损失为0，意味着模型已经满足了我们的要求；反之，损失大于0，模型需要进一步优化以拉近Anchor与Positive的距离，同时推远Anchor与Negative的距离。 5. 采样策略： - 选择有效的采样策略对于三元组损失函数至关重要。硬负例挖掘（hard negative mining）是一种常用的策略，即专门挑选那些难以区分的Negative样本，这些样本与Anchor的距离很接近，这有助于模型学习更精细的特征。 - 而软采样（semi-hard negative mining）则是选择那些比Positive样本离Anchor稍远一点的Negative样本，这样的样本更有针对性地帮助模型提升。 6. 实施训练： - 在训练循环中，你需要为每个批次（batch）内的每个Anchor找到相应的Positive和Negative样本，计算损失，然后反向传播以更新模型的权重。确保在整个过程中监控损失函数和模型性能，以便适时调整超参数，如学习率、margin值以及采样策略。自己再挖掘挖掘，希望有益！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。