机器学习概述(自用)

概念

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

工作流程

获取数据,数据基本处理(对数据进行缺失值、去除异常值等操作),特征工程,机器学习(模型训练),模型评估

数据集中,一般一行数据称为一个样本,一列数据称为个特征

特征工程

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程

特征工程包括
特征提取:将数据转换为机器学习的数字特征
特征预处理:通过一些转换函数将特征数据转换成更适合算法模型的特征数据过程
特征降维:降低随机变量(特征)个数

模型评估

拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合。

欠拟合

模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。
在这里插入图片描述

过拟合

所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳
在这里插入图片描述

算法分类

监督学习

输入数据是由输入特征值和目标值所组成的
函数输出可以是连续的值(回归)也可以是有限个离散值(分类)

回归问题

预测房价,根据样本拟合出一条连续曲线
在这里插入图片描述

分类问题

根据肿瘤特征判断良性还是恶性
在这里插入图片描述

无监督学习

输入数据是由输入特征值组成,没有目标值
输入数据没有被标记,也没有确定的结果,样本数据类别未知
需要根据样本间的相似性对样本集进行类别划分
在这里插入图片描述

半监督学习

训练集同时包含有标记样本数据和未标记样本数据

强化学习

实际上是决策问题,即自动进行决策,并且可以做连续决策。

深度学习

机器学习的一个分支,神经网络各层负责不同内容

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

醋酸洋红就是我

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值