python入门机器学习1

机器学习

初识机器学习——什么是机器学习?

西瓜数据集

编号色泽根蒂敲声好瓜
1青绿蜷缩浊响
2乌黑蜷缩浊响
3青绿硬挺清脆
4乌黑稍蜷沉闷

数据集:这组记录的集合

样本:其中每条记录是关于一个事件或对象(这里是一个西瓜)的描述

特征:反映对象在某方面的性质的事项,例如“色泽”“根蒂”“敲声”

特征值:属性上的取值,例如“青绿”“乌黑”

样本空间:由特征张成的空间,例如我们把“色泽”“根蒂”“敲声”作为三
个坐标轴,每个西瓜都可在这个空间中找到自己的坐标位置。

特征向量:空间中的每个点都对应一个坐标向量

模型:输入数据,即可得到预测结果,如何选择最好最高效的模型就是机器学习的目标

数据集(相对于深度学习来说数据量要求较少)分为训练集和测试集

标记信息:例如(青绿,蜷缩,浊响,好瓜),其中的好瓜为标记,拥有标记信息的示例被称为样例(注意:分类和回归问题需要标记数据,而聚类一般不需要)

分类:预测的结果是离散值,比如“好瓜”,“坏瓜”

回归:预测的结果是连续值,比如西瓜的成熟度为0.95,0.37

聚类:用相关算法自动将训练集中的西瓜分为若干组,每一组叫做一簇,存在一些潜在的划分需要自己去寻找

机器学习分为两大类:监督学习,无监督学习

监督学习:主要用于分类与回归,在机器学习过程提供对错指示,从给定的训练集中学习一个目标函数,可以用这个函数预测结果,监督学习要求包括输入与输出

非监督学习:利用K方式建立中心,通过循环和递减运算减小误差得到分类的目的。

  • 9
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值