简洁机器学习方法

背景
12月份有的同学参加了新工联盟一级的测评考试,一级的内容主要是包括一些计算机基础、大数据基本知识、数据操作和处理、数据分析方法和数据可视化方法,今天就简单分享其中一部分内容(持续更新)。

一、机器学习
1.监督学习
①理解:所谓的监督学习,就是我们首先导入包含有训练属性和目标属性的数据集,然后监督学习算法会从数据集中学习得出训练样本和其目标变量之间的关系,然后将学习到的关系对新样本(未被标记的样本)进行分类。

②举例:我们可以根据学生学习时间预测考试成绩的例子,监督学习算法的目标是给出新的输入X,使得预测结果Y的准确率最大: Y = F(X)+ M
F:学习时间和考试成绩之间的关系
X表示输入(学习小时数)
Y表示输出(考试分数)
M表示随机误差

③实现方法:分类、回归
举例:分类:判断是优质还是劣质;回归:房子售价是多少

④分类:医学研究员要分析某种病症的数据,用于预测患者使用三种治疗方案中的哪一种。该数据分析问题就属于分类问题,通过建立分类模型来预测类别标签,例如“治疗方案A”、“治疗方案B”或者“治疗方案C”。分类是一个预测类别标签的预测问题,这些类别标签都是离散和无序的。分类包含两个步骤:学习步骤和分类步骤。
常见的分类算法:K近邻、决策树、朴素贝叶斯、支持向量机

⑤回归:回归通常被定义为确定两个或多个变量之间的相关关系。比如:你要通过给定的数据X预测一个人的收入。目标变量是指该变量是我们关心以及想要预测的未知变量,而连续是指Y的取值没有间隔。你的输入应当包含所有与收入相关的个人信息,例如工作时长、教育经历、职称以及他的曾住地等。
常见的回归模型有:线性回归、逻辑回归、多项式回归

二、非监督学习
①理解:输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类,试图使类内差距最小化,类间差距最大化。

②非监督学习的方法分为两大类:聚类分析、关联分析

③无监督学习算法:
EM算法、K-MEANS聚类、稀疏自编码、限制波尔兹曼机、高斯混合模型

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值