【机器学习基础】CH1 - 简介

最新推荐文章于 2024-07-16 10:03:46 发布

reindexx

最新推荐文章于 2024-07-16 10:03:46 发布

阅读量353

点赞数

分类专栏：机器学习文章标签：机器学习人工智能神经网络

本文链接：https://blog.csdn.net/weixin_43831311/article/details/120068211

版权

12 篇文章 3 订阅

订阅专栏

机器如何通过学习而拥有思维的方法论。
学习过程 ：“ A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T , as measured by P, improves with experience E." 一个计算机程序从 经验E 中学习某些类别的 任务T 。如果它在任务T上的 表现P 随着经验E的提高而提高，则称这个程序能从经验E中学习。
机器学习是对学习算法的研究，通常是人工智能的子集。
分类：
（1）监督学习
（2）非监督学习
（3）强化学习
推荐书目：
（1）The Elements of Statistical Learning
（2）Foundations of Machine Learning
（3）Pattern Recognition and Machine Learning

在这里插入图片描述

无序数据（分类）
如，给一张照片分类（苹果，橘子，梨），结果也是离散的，但它们没有自然顺序
为了嵌入分类数据，可以使用 one-hot 编码 来表示标签
one-hot encoding 的优点：任何两两标签之间的距离都一样(都是 $\sqrt{2}$ )，体现了无序性。（ 但表示有序数据的实数集中两两数据之间的距离和它们的固有顺序有关）

在这里插入图片描述

注意：分类不是独立的，它们的交集也很广泛的应用

评估学习过程的性能指标P：
（1）loss function 损失函数即为性能指标
（2）我们的目标为减少损失，即最大化性能
（3）最大化性能指的是让我们的model能很好的预测 新的数据
数据集 $\mathcal{D}$
（1）通常， $\mathcal{D}=\mathcal{D}_{train}\cup\mathcal{D}_{test}$
（2） $\mathcal{D}_{train}$ ：训练模型用的数据集
（3） $\mathcal{D}_{test}$ ：作为评估模型的新数据
（4）通常数据集的分配是随机的
（5）对于特定的应用，将按要求分配数据集。如：预测股票的价格，训练集为过去的数据，而测试集为将来的数据（目前没有搜集到），这样我们的模型才不会受到特定时间等因素的影响。
（6）如果数据标签严重不平衡，应该考虑其他分配方案。
（7）另一种可能的分配： $\mathcal{D}=\mathcal{D}_{train}\cup\mathcal{D}_{valid}\cup\mathcal{D}_{test}$ ，其中 $\mathcal{D}_{valid}$ 用于调整超参数hyper-parameters（如决策树的深度，神经网络的层数），并用于模型选择。可由cross-validation交叉检验优化 / 可以看做测试集的代替品，只能用于评估模型。
（8）不是所有模型的评估都需要测试集，如求微分方程的解可以直接带入检查。

在这里插入图片描述

关注