机器学习（2）

HHHhhhhhhhhhhallla

已于 2022-05-17 20:44:42 修改

阅读量134

点赞数

分类专栏：机器学习文章标签：机器学习回归深度学习

于 2022-05-17 14:34:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39661275/article/details/124819468

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

有监督学习

有监督学习和无监督学习的区别在于输入的数据是否带有标签。有监督学习通过带标签的训练数据，学习如何预测未知数据的标签问题，其主要分为两个方面的问题：分类和回归。当输出是离散的，学习任务为分类任务，当输出为连续的，学习任务为回归任务。

回归

回归定义

Regression 就是找到一个函数 $f u n c t i o n$ ，通过输入特征 $x$ ，输出一个数值 $S c a l a r$ 。例如股市预测、自动驾驶和推荐系统等。

模型步骤

step1：模型假设，选择模型框架（线性模型） 
step2：模型评估，如何判断众多模型的好坏（损失函数） 
step3：模型优化，如何筛选最优的模型（梯度下降）

Step 1：：模型假设 - 线性模型

a.一元线性模型（单个特征）
以一个特征 $x$ 为例，线性模型假设 $y = b + w \cdot x$ ，所以 $w$ 和 $b$ 可以猜测很多模型：
$f 1 : y = 10.0 + 9.0 \cdot x$ $f 2 : y = - 0.8 + 12.0 \cdot x$

b.多元线性模型（多个特征）
在实际应用中，输入特征肯定不止 $x_{1}$ 这一个，所以我们假设线性模型 Linear model： $\sum w_{i} x_{i}$

$x_{i}$ ：就是各种特征(fetrure) $x_{cp},x_{hp},···$
$w i$ ：各个特征的权重 $w_{cp},w_{hp},···$
$b$ ：偏移量

Step 2：模型评估 - 损失函数

从数学的角度来讲，我们使用距离。求【真实的y值】与【模型预测的y值】差，来判定模型的好坏，也就是使用损失函数（Loss function）来衡量模型的好坏。

Loss function： $\sum({y}^i - (b + w·x_{i}) )^2$

在这里插入图片描述

Step 3：最佳模型 - 梯度下降

已知损失函数是 $\sum({y}^i - (b + w·x_{i}) )^2$ ，需要找到一个令结果最小的 $L^*$ ，在实际的场景中，我们遇到的参数肯定不止 $w$ , $b$ 。常用方法：梯度下降，根据微分结果，即当前斜率，根据斜率来判定移动方向。

一般步骤：

步骤1：随机选取一个 $w^0$
步骤2：计算微分，也就是当前的斜率，根据斜率来判定移动的方向
- 大于0向右移动（增加 $w$ ）
- 小于0向左移动（减少 $w$ ）
步骤3：根据学习率移动（移动的步长）
重复步骤2和步骤3，直到找到最低点

单个特征：

多个特征：

在这里插入图片描述

常见问题

当建立的模型越来越复杂时，即加入越来越多的特征时，可能会出现过拟合的问题，即在training set上表现优秀的模型反而在testing set上的效果更差。
在这里插入图片描述

步骤优化

1.重新定义模型
2.加入更多特征和更多输入数据
3.加入正则化，考虑每个特征的权重之和

HHHhhhhhhhhhhallla

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（2）

有监督学习有监督学习和无监督学习的区别在于输入的数据是否带有标签。有监督学习通过带标签的训练数据，学习如何预测未知数据的标签问题，其主要分为两个方面的问题：分类和回归。当输出是离散的，学习任务为分类任务，当输出为连续的，学习任务为回归任务。回归回归定义Regression 就是找到一个函数 functionfunctionfunction ，通过输入特征 xxx，输出一个数值 ScalarScalarScalar。例如股市预测、自动驾驶和推荐系统等。模型步骤step1：模型假设，选择模型框架（
复制链接

扫一扫

专栏目录

HHHhhhhhhhhhhallla CSDN认证博客专家 CSDN认证企业博客

码龄7年

13: 原创

22万+: 周排名

150万+: 总排名

6170: 访问

: 等级

152: 积分

1: 粉丝

8: 获赞

5: 评论

14: 收藏

私信

关注

热门文章

分类专栏

c++ 2篇
slam
机器学习 7篇
牛客 3篇
ros 2篇

最新评论

map的insert和emplace比较
程序猿皮卡丘: 简单精辟，感谢作者
strcpy问题
kxhsq: strcpy 1 不是只能是数组名吗
在ROS中创建工作区时出现错误
hinihao234 回复 hinihao234: 我是在Ubuntu18.04上安装melodic后出现的错误，catkin_make 目前还是不能成功
在ROS中创建工作区时出现错误
hinihao234: 我按照这个教程做了，又报了一个新错误AttributeError: module 'enum' has no attribute 'IntFlag'。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。