机器学习算法(一)

最新推荐文章于 2022-09-21 11:35:26 发布

一元二肆

最新推荐文章于 2022-09-21 11:35:26 发布

阅读量182

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TENapples/article/details/102905813

版权

机器学习基础内容

机器学习的定义

为了解决任务T,设计一段程序,从经验E中学习，达到性能度量值Ｐ，当且仅当有了经验E后，经过P评判没程序在处理T时的性能得到提升

机器学习的分类

1.有监督学习 (带答案数据):回归 ,分类
2.无监督学习 (无答案数据):聚类,降维
3.强化学习 :有模型学习,无模型学习

分类问题

样本标签属于离散变量,比如判断垃圾邮件,肿瘤检测

回归问题

样本标签属于连续变量,比如预测房价,预测销售额

连续变量

可以任意取值的变量
例如:生产零件的规格尺寸,体测的身高,体重,胸围等

离散变量

非数值型变量
例如:性别,教育程度,学校,职称,可以把变量通过转换变成自然数

分类问题

1.生成模型(概率模型)

先从总体提取特征模型学习一个决策边界,然后从个体提取特征放到模型里进行判断

2.判别模型(非概率模型)

分别学习出两个模型,再从样本提取的模型特征放到这两个模型中查看占比,哪个概率大就是哪种

条件概率

事件A在事件B发生的条件下发生的概率
在这里插入图片描述

常用的交流标识

在这里插入图片描述

机器学习方法的三要素

1.模型

学习的概率分布或决策函数,所有可能的条件概率分布或者决策函数
构成的集合就是概率模型的假设空间

2.策略

从假设空间中学习最优的模型方法,称为策略
衡量模型好不好的指标------->损失函数(风险函数)或者代价函数
用来度量预测错误的程度,记作 L(Y,f(x))
1)0-1损失函数
2)平分损失函数
3)绝对损失函数
4)对数损失函数(交叉熵损失函数)

在这里插入图片描述

3.算法

学习模型时的具体算法,求解最优模型归结为一个最优化问题,统计学习
的算法等价于求解最优化问题的算法,也就是求解析解或者数值解

4.评估

线性回归

损失函数

在这里插入图片描述

梯度下降算法

1.随机选择一个参数组合,计算代价函数
2.寻找下一个能让代价函数值最低的参数组合
3.持续这么做直到一个局部最小值

单变量函数中,梯度就是函数的微分,代表函数某个给定点切线的斜率

在这里插入图片描述

求出代价函数的导数
在这里插入图片描述

ＢＧＤ：批量梯度下降：下降的每一步采用所有数据来梯度下降

在这里插入图片描述

SGD:随机梯度下降法:每次用一个样本梯度下降

在这里插入图片描述

优点:训练速度快,对于准确度来说,可能得到局部最小值
缺点:迭代的方向变化很大,不能很快的收敛到局部最优解

MBGD:小批量梯度下降

在这里插入图片描述

优点:使用多个样本相比SGD提高梯度估计的精度
缺点:每次梯度估计的方向不确定
Mini-batch大小的选择通常用Z的幂数,可以获取更少的运行时间

使用梯度下降求极值时,涉及哪几个部分

1.算法的步长选择
2.算法参观的初始值选择(凸函数一定有最优解)
3.归一化
在这里插入图片描述

标准化
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法(一)

机器学习基础内容机器学习的定义为了解决任务T,设计一段程序,从经验E中学习，达到性能度量值Ｐ，当且仅当有了经验E后，经过P评判没程序在处理T时的性能得到提升机器学习的分类1.有监督学习 (带答案数据):回归 ,分类2.无监督学习 (无答案数据):聚类,降维3.强化学习 :有模型学习,无模型学习分类问题样本标签属于离散变量,比如判断垃圾邮件,肿瘤检测回归问题样本标签属于连...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。