机器学习实战笔记-1基础

机器学习基础

什么是机器学习

机器学习能让我们从数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义。简单的说机器学习就是把无序数据转换成有用的信息。

关键术语

特征(属性):对一类物体我们关心的性质,比如鸟的体重、翼展、脚蹼、后背颜色等

训练集:已经有分类的大量数据,是用来训练机器学习算法的数据样本集合。

训练样本:实例数据

目标变量:机器学习的预测结果

训练数据:用来训练算法

测试数据:用来评估算法

监督学习:

无监督学习:

机器学习主要任务

机器学习的主要任务时分类和回归。

分类和回归都属于监督学习。分类和回归的区别是回归用于预测数值型数据。

在无监督学习中:

聚类:将数据集合分层有类似的对象组成的多个类的过程

密度分析:寻找描述数据统计值的过程

如果选择合适算法:

选择的依据:

1使用算法的目的,2分析或者收集的数据是什么

选择的过程:

1根据目的首先划分是监督学习,还是无监督学习。如果要预测目标变量的值,则可以选择监督学习算法,否则选择无监督学习算法

2如果是监督学习:进一步确定目标变量的类型,如果是离散型,选择分类算法;否则选择回归算法

3如果是非监督学习:进一步分析是否仅仅需要将数据划分为离散的组,如果是则选择聚类算法,否则选择密度估计算法。

开发的步骤

1 收集数据:爬虫、传感器等

2 准备输入数据:格式处理等

3 分析输入数据:确保数据集中无垃圾数据。

4 训练算法:(无监督学习不需要训练算法)

5 测试数据:

6 使用算法


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值