机器学习主要任务概览
机器学习的真实含义是利用计算机彰显数据背后的真实含义,把无序的数据转换成有用的信息。智能手机通常带有三轴磁力计、偏航率陀螺仪、三轴加速计、温度传感器和GPS接收器等传感器,方便收集海量数据。(注:本文知识点总结来源于《机器学习实战》第1章 机器学习基础)
一、机器学习主要分为:
- 监督学习:1)分类(目标变量通常为标称型,即离散有限集合,特征或属性—>类别) 2)回归(目标变量通常为连续型,即连续无限集合);
主要用于预测目标变量的值。
之所以称之为监督学习,是因为这类算法必须知道目标变量的分类信息。 - 非监督学习:1)聚类 2)密度估计;
若不需要预测目标变量的值,且唯一需求是将数据划分为离散的组,则使用聚类;
若还需要估计数据与每个分组的相似程度,则使用密度估计算法。
二、开发机器学习应用的主要步骤
3. 收集数据
4. 分析数据(确保数据集中没有垃圾数据)
5. 数据预处理
6. 训练算法(无监督学习通常跳过此步骤)
7. 测试算法
8. 使用算法