简洁机器学习方法

最新推荐文章于 2024-01-23 17:05:32 发布

Do.it

最新推荐文章于 2024-01-23 17:05:32 发布

阅读量185

点赞数

分类专栏：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40769121/article/details/110527948

版权

数据分析专栏收录该内容

8 篇文章 2 订阅

订阅专栏

背景
12月份有的同学参加了新工联盟一级的测评考试，一级的内容主要是包括一些计算机基础、大数据基本知识、数据操作和处理、数据分析方法和数据可视化方法，今天就简单分享其中一部分内容（持续更新）。

一、机器学习
1.监督学习
①理解：所谓的监督学习，就是我们首先导入包含有训练属性和目标属性的数据集，然后监督学习算法会从数据集中学习得出训练样本和其目标变量之间的关系，然后将学习到的关系对新样本（未被标记的样本）进行分类。

②举例：我们可以根据学生学习时间预测考试成绩的例子，监督学习算法的目标是给出新的输入X，使得预测结果Y的准确率最大： Y = F(X)+ M
F：学习时间和考试成绩之间的关系
X表示输入（学习小时数）
Y表示输出（考试分数）
M表示随机误差

③实现方法：分类、回归
举例：分类：判断是优质还是劣质；回归：房子售价是多少

④分类：医学研究员要分析某种病症的数据，用于预测患者使用三种治疗方案中的哪一种。该数据分析问题就属于分类问题，通过建立分类模型来预测类别标签，例如“治疗方案A”、“治疗方案B”或者“治疗方案C”。分类是一个预测类别标签的预测问题，这些类别标签都是离散和无序的。分类包含两个步骤：学习步骤和分类步骤。
常见的分类算法：K近邻、决策树、朴素贝叶斯、支持向量机

⑤回归：回归通常被定义为确定两个或多个变量之间的相关关系。比如：你要通过给定的数据X预测一个人的收入。目标变量是指该变量是我们关心以及想要预测的未知变量，而连续是指Y的取值没有间隔。你的输入应当包含所有与收入相关的个人信息，例如工作时长、教育经历、职称以及他的曾住地等。
常见的回归模型有：线性回归、逻辑回归、多项式回归

二、非监督学习
①理解：输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类，试图使类内差距最小化，类间差距最大化。

②非监督学习的方法分为两大类：聚类分析、关联分析

③无监督学习算法：
EM算法、K-MEANS聚类、稀疏自编码、限制波尔兹曼机、高斯混合模型

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
简洁机器学习方法

背景12月份有的同学参加了新工联盟一级的测评考试，一级的内容主要是包括一些计算机基础、大数据基本知识、数据操作和处理、数据分析方法和数据可视化方法，今天就简单分享其中一部分内容（持续更新）。一、机器学习1.监督学习①理解：所谓的监督学习，就是我们首先导入包含有训练属性和目标属性的数据集，然后监督学习算法会从数据集中学习得出训练样本和其目标变量之间的关系，然后将学习到的关系对新样本（未被标记的样本）进行分类。②举例：我们可以根据学生学习时间预测考试成绩的例子，监督学习算法的目标是给出新的输入X，使得
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。