ML demo1

CodeF4mmer

已于 2022-09-30 17:12:32 修改

阅读量108

点赞数

文章标签：机器学习数据挖掘人工智能

于 2022-09-29 22:46:06 首次发布

本文链接：https://blog.csdn.net/qq_43335292/article/details/127115377

版权

lecture2: Prediction and Classification

Perceptron Hypothesis Set 感知器假设集

对于日常事务，我们获取其数据，通过机器学习让机器能够获得预测，推理，建议，辨认等能力。

为此，应该将问题及知识符号化、形式化，使其变成机器能够储存和处理的形式。

？辨析f与g的关系：

f为理想情况下，输入x与输出y之间的关系

g为通过机器学习后，对于f的近似模拟

机器学习与数据挖掘

机器学习：通过对于数据的计算，得到近似目标f的假设g

数据挖掘：通过庞大的数据，得到有价值的规律及财富？

？？问：对于数据而言，价值判断标准是什么？如何制定。
是抽象的数字概念还是能够具体反映于问题本身。

关系:

· 当数据挖掘中想得到的规律及价值是对目标（关系）的近似，此时ML=DM(KDDCup)

· 如果其价值近似于关系近似，DM can help ML,and vice versa(反之亦然)

· 传统的数据分析也注重在大型数据库中高效的计算

在现实中，区分两者的边界并不清晰

Hyperplanes/linear classifiers 超平面及线性分类器

一、简单的假设集：感知器

？？假设集：Hypothesis Set 更像是一种关系模式

首先学习的这种关系模式是感知器(Perceptron)。

给定用户的年龄，年收入，已工作年限及负债情况，来制定放贷策略。

将客户特征(features)记为向量x=( $x_1$ , $x_2$ ,…, $x_d$ )，并赋权。根据该用户特征向量的权值组合与设定阈值大小关系，来判断是否放贷。

问：如何确定阈值，如何确定权重。

根据感知器假设，对于输出y来说，将给予放贷的个体记为+1，不予放贷的记为-1。

以下为感知器假设的处理：将阈值归设置为向量首元素，将结果函数用规整形式表达。
$\begin{aligned} h(\mathbf{x}) &=\operatorname{sign}\left(\left(\sum_{i=1}^d w_i x_i\right)-\text { threshold }\right) \\ &=\operatorname{sign}(\left(\sum_{i=1}^d w_i x_i\right)+\underbrace{(-\text { threshold })}_{w_0} \cdot \underbrace{(+1)}_{x_0}) \\ &=\operatorname{sign}\left(\sum_{i=0}^d w_i x_i\right) \\ &=\operatorname{sign}\left(\mathbf{w}^T \mathbf{x}\right) \end{aligned}$