【机器学习（1）】基本概念、监督学习与非监督学习、分类与回归和模型评估

最新推荐文章于 2022-10-20 15:10:33 发布

lys_828

最新推荐文章于 2022-10-20 15:10:33 发布

阅读量2.1k

点赞数 4

分类专栏：机器学习文章标签：机器学习深度学习人工智能监督学习与非监督学习分类与回归

本文链接：https://blog.csdn.net/lys_828/article/details/104413744

版权

机器学习专栏收录该内容

18 篇文章 59 订阅

订阅专栏

机器学习是什么

数据 ————> > 经验、规律 ————> > 预测、判断（由数据总结出经验和规律并应用于预测和判断）
在这里插入图片描述

机器学习基本术语

数据集	特征（自变量） + 标签（因变量）
Y：标签（label）	也可以叫因变量，希望预测及解释的核心变量
X：特征（features）	也叫自变量，反映事物或对象的某方面的表现性质
样本（sample）	数据集中关于事物或者对象的每一条记录
模型（model）	规律和经验
学习（learning）	从数据中总结规律的过程
训练集（training data set）	模型学习的教材
验证集（testing data set）	检验模型的考试题
误差（error）	衡量模型准确性的指标

比如下图中，左侧就是特征（自变量），右侧即为标签（因变量）
在这里插入图片描述

监督学习与非监督学习

1）监督学习里面的监督指的是什么？
监督（supervision）：指的就是前面提到的Y

2）监督学习：在因变量或标签（Y）监督下的学习过程
目标：在数据集中寻找自变量（X）与因变量（Y）之间的关系
核心特征：数据集中有因变量或者标签（Y）

3）监督学习的应用：
a. 房价预测
       自变量：面积、房价等房屋属性
       因变量：房屋价格
在这里插入图片描述
b. 图像识别
       自变量：原始图像像素
       因变量：图像中物体的标签

c. 银行信用评估
       自变量：客户的信用行为
       因变量：该客户是否存在信用风险

d. 语义识别
       自变量：文本
       因变量：文本含义
在这里插入图片描述
4）非监督学习：不存在因变量或标签（Y）监督下的学习过程
       目标：在数据集中挖掘有价值的或有趣的信息或结构
       核心特征：数据集中没有因变量或者标签