第一章机器学习基础

最新推荐文章于 2024-07-08 18:05:38 发布

m0_53021390

最新推荐文章于 2024-07-08 18:05:38 发布

阅读量499

点赞数 5

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53021390/article/details/139663160

版权

一：基本概念

机器学习：让机器具备一个找函数的能力

回归：假设要找的函数的输出是一个数值，一个标量（scalar），找到这个函数的过程。

分类：准备好一些选项，这些选项称为类别（class），现在要找的函数的输出就是从设定好的选项里面让机器选择一个当作输出，该任务称为分类。

结构化学习：叫机器产生有结构的东西的问题称为结构化学习

知识领域：通常一个模型的修改，往往来自于对这个问题的理解，即领域知识。

二：机器学习找函数的步骤

1.Function with unknown parameter写出带有未知参数的函数

例如： $y=b+w*x1$ 示例以该式进行

x1是前一天的观看人数 y是当天的观看人数均为已知

w 称为权重（weight），b 称为偏置（bias）

2.Define Loss from Training Data

Loss：也是一个function 该函数的输入是由第一步找到的函数的未知参数即为上式的b和w

训练数据：指的是将以往的数据进行带入判断我们设立的未知参数对不对将预估结果和真实结果进行一个比对将预估结果和真实结果进行误差的计算统计 L即为统计和平均值 L和误差成正相关带入不同的未知参数计算L 选取最适配的未知参数组合

3.最优化问题

使用梯度下降（gradient descent）

不断测试最后可能只达到Local minima 局部最小实际上无法达到global minima全局最小

三：线性模型

概念：模型都是把输入的特征 x 乘上一个权重，再加上一个偏置就得到预测的结果，这样的模型称为线性模型（linear model）。

但普通的线性模型（Linear Model）过于简单我们需要复杂的函数设置更有弹性的函数

因此引入分段线性曲线：常数项+一系列的Function

四：分段线性曲线

如上图所示若要形成红色曲线需要多个蓝色函数进行叠加我们用Sigmoid函数来无限逼近蓝色函数

1.Sigmoid 函数的表达式为

$y=c\frac{1}{1+e^{-(b+wx1)}}$

其横轴输入是 x1，输出是 y，c 为常数。

如果 x1 的值，趋近于无穷大的时候， $e^{-(b+wx1)}$ 这一项就会消失，当 x1 非常大的时候，这一条就会收敛在高度为 c 的地方。如果 x1 负的非常大的时候，分母的地方就会非常大，y 的值就会趋近于 0。

2.Hard Sigmoid

蓝色函数命名为Hard Sigmoid函数

3.使用Sigmoid函数来无限逼近Hard Sigmoid

调整函数表达式中的 b、w 和 c 可以制造各种不同形状的 Sigmoid 函数，用各种不同形状的 Sigmoid 函数去逼近 Hard Sigmoid 函数。

蓝色函数的表达式：y = cσ(b + wx1) 即为y = cSigmoid(b + wx1)

$y=b+\sum Ci Sigmoid (b+wx1)$

多个蓝色函数表达式相加来逼近红色函数得到函数

$y = b+\sum_{i}^{} Ci Sigmoid(bi + wi x1)$ 该式仅用前一天的数值作为参数若需要用多天数值作为参数则函数变为 $y = b+\sum_{i}^{} Ci Sigmoid(bi +\sum_{j}^{} wijxj)$

所有的未知的参数，一律统称 θ 进行未知参数对L的微分得到

再进行参数的更新

五：模型变形

Hard Sigmoid 可以看作是两个修正线性单元（Rectified Linear Unit，ReLU）的加总，ReLU 的图像有一个水平的线，走到某个地方有一个转折的点，变成一个斜坡，其对应的公式为 c ∗ max(0, b + wx1)

Sigmoid 或 ReLU 称为激活函数（activation function。继续改变模型不断的更新未知参数通过Sigmoid函数或者ReLU

Sigmoid 或 ReLU 称为神经元（neuron），很多的神经元称为神经网络（neural network）。

在训练数据和测试数据上的结果是不一致的，这种情况称为过拟合（overfitting）。

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
第一章机器学习基础

Hard Sigmoid 可以看作是两个修正线性单元（Rectified Linear Unit，ReLU）的加总，ReLU 的图像有一个水平的线，走到某个地方有一个转折的点，变成一个斜坡，其对应的公式为 c ∗ max(0, b + wx1)训练数据：指的是将以往的数据进行带入判断我们设立的未知参数对不对将预估结果和真实结果进行一个比对将预估结果和真实结果进行误差的计算统计 L即为统计和平均值 L和误差成正相关带入不同的未知参数计算L 选取最适配的未知参数组合。
复制链接

扫一扫

博客等级

码龄4年

1
原创

5
点赞

8
收藏

8
粉丝

关注

私信

热门文章

第一章机器学习基础 499

最新评论

第一章机器学习基础
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。