机器学习导论

最新推荐文章于 2023-04-11 11:43:32 发布

howardSunJiahao

最新推荐文章于 2023-04-11 11:43:32 发布

阅读量867

点赞数 1

分类专栏：机器学习文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/weixin_47524903/article/details/122545084

版权

2 篇文章 0 订阅

订阅专栏

机器学习算法的一般应用框架：

模型是什么？模型是用来描述某个特定现象或事物的，可以分为如下种类：

归纳模型（Inductive inference）：由一个数学公式构成，公式中的每个变量都具有明确的物理意义，能够真正描述目标系统的规律。比如牛顿定律的公式，其中的每一个变量都有明确的物理意义，比如质量、距离。
预测模型（Predictive inference）：往往由一个万能函数构成，由许多参数组成，每个参数一般不具备任何物理意义。一般只能模拟或预测目标系统的输出。
直推模型（Transductive）：没有明确的模型或函数，但可计算出模型在特定点的值。比如KNN算法。

knn一般指邻近算法。邻近算法，或者说K最邻近（KNN，K-NearestNeighbor）分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是K个最近的邻居的意思，说的是每个样本都可以用它最接近的K个邻近值来代表。

三种模型的比较：

传统机器学习 vs 深度学习

非监督学习和监督学习
- 非监督学习：不需要训练样本，如聚类
- 监督学习：需要训练样本 $T=\{x_i,y_i\}_l^N$ 的机器学习算法，如大多数分类、回归算法。
生成模型和判别模型
- 生成模型：计算数据x与标签y的联合概率 $P (x, y)$ ，用下列公式计算分类概率： $P (y ∣ x) = P (x, y) / P (x)$
- 判别模型：直接计算分类概率 $P (y ∣ x)$
简单数据模型与复杂数据模型
- 简单数据模型：被用来处理相互独立的简单数据
- 复杂数据模型：被用来处理时空关联性的复杂数据

Structural model：我们选择哪一类函数 $f(x,\Theta)$ 建立模型
Error model：我们选择哪一类损失模型（loss function） $L(y,f(x,\Theta))$ 来做训练？损失函数相当于为模型的选择制定考核标准
Optimization procedure：我们选择哪一种数值计算方法来获取最优模型 $f^*(x,\Theta)$