机器学习概述（自用）

醋酸洋红就是我

已于 2023-06-05 17:50:16 修改

阅读量315

点赞数

分类专栏：机器学习文章标签：机器学习人工智能深度学习

于 2023-06-05 14:41:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40527560/article/details/130883685

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

目录

概念
工作流程
算法分类
深度学习

概念

机器学习是从数据中自动分析获得模型，并利用模型对未知数据进行预测

工作流程

获取数据，数据基本处理（对数据进行缺失值、去除异常值等操作），特征工程，机器学习（模型训练），模型评估

数据集中，一般一行数据称为一个样本，一列数据称为个特征

特征工程

特征工程是使用专业背景知识和技巧处理数据，使得特征能在机器学习算法上发挥更好的作用的过程

特征工程包括
特征提取：将数据转换为机器学习的数字特征
特征预处理：通过一些转换函数将特征数据转换成更适合算法模型的特征数据过程
特征降维：降低随机变量（特征）个数

模型评估

拟合

模型评估用于评价训练好的的模型的表现效果，其表现效果大致可以分为两类：过拟合、欠拟合。

欠拟合

模型学习的太过粗糙，连训练集中的样本数据特征关系都没有学出来。
在这里插入图片描述

过拟合

所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在测试数据集中表现不佳
在这里插入图片描述

算法分类

监督学习

输入数据是由输入特征值和目标值所组成的
函数输出可以是连续的值（回归）也可以是有限个离散值（分类）

回归问题

预测房价，根据样本拟合出一条连续曲线
在这里插入图片描述

分类问题

根据肿瘤特征判断良性还是恶性
在这里插入图片描述

无监督学习

输入数据是由输入特征值组成，没有目标值
输入数据没有被标记，也没有确定的结果，样本数据类别未知
需要根据样本间的相似性对样本集进行类别划分
在这里插入图片描述

半监督学习

训练集同时包含有标记样本数据和未标记样本数据

强化学习

实际上是决策问题，即自动进行决策，并且可以做连续决策。

深度学习

机器学习的一个分支，神经网络各层负责不同内容

醋酸洋红就是我

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
机器学习概述（自用）

特征工程是使用专业背景知识和技巧处理数据，使得特征能在机器学习算法上发挥更好的作用的过程。模型评估用于评价训练好的的模型的表现效果，其表现效果大致可以分为两类：过拟合、欠拟合。特征预处理：通过一些转换函数将特征数据转换成更适合算法模型的特征数据过程。机器学习是从数据中自动分析获得模型，并利用模型对未知数据进行预测。获取数据，数据基本处理，特征工程，机器学习（模型训练），模型评估。模型学习的太过粗糙，连训练集中的样本数据特征关系都没有学出来。输入数据没有被标记，也没有确定的结果，样本数据类别未知。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

醋酸洋红就是我 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。