文章目录
机器学习的流程以及部分概念简介
这是我进行机器学习的第一天,看了一些资料,讲的有些杂乱,还得自己看了好一会儿资料,才把这个流程给整理了出来。如果有问题,还请各位大佬多多指正。
个人觉得,在进行相关学习之前,务必要对及其学习的相关流程进行一些梳理,只有把这个流程大体梳理明白了,框架搭起来了,才能对及其学习有一个整体的概念之后的学习,我也将围绕这个流程进行逐一的学习和攻破。
step1.明确需求,具体要做什么务必要明确
step2.首先得获取数据,数据的获取有如下途径:
- 公司自己就有所需数据
- 公司与其他机构合作,获取相关数据
- 购买数据
step3.对数据进行基本处理
我们在获得原始数据之后,并不是一股脑的把这些数据全都拿来使用,实际上,数据在整个机器学习阶段大致经历了这样一个流程:
(原始数据–>数据清洗(形成特征)–>数据预处理–>特征工程–>进入到模型进行训练)
关于数据清洗,他与数据预处理的界限其实很模糊。很多时候甚至分不清彼此。因此,有不少资料甚至直接把这两个混为一谈。具体是什么,直接看看这个文章:数据清洗
在基本处理的过程中,numpy,pandas等就派上了用场&#x