机器学习(一)机器学习的流程以及部分概念简介

本文介绍了机器学习的基本流程,包括明确需求、获取数据、数据处理、特征工程、选择算法、模型评估和上线使用。重点讲述了特征工程的重要性和数据的类型与结构,以及监督学习与非监督学习的区别。
摘要由CSDN通过智能技术生成

机器学习的流程以及部分概念简介

这是我进行机器学习的第一天,看了一些资料,讲的有些杂乱,还得自己看了好一会儿资料,才把这个流程给整理了出来。如果有问题,还请各位大佬多多指正。
个人觉得,在进行相关学习之前,务必要对及其学习的相关流程进行一些梳理,只有把这个流程大体梳理明白了,框架搭起来了,才能对及其学习有一个整体的概念之后的学习,我也将围绕这个流程进行逐一的学习和攻破。

step1.明确需求,具体要做什么务必要明确

step2.首先得获取数据,数据的获取有如下途径:

  • 公司自己就有所需数据
  • 公司与其他机构合作,获取相关数据
  • 购买数据

step3.对数据进行基本处理

我们在获得原始数据之后,并不是一股脑的把这些数据全都拿来使用,实际上,数据在整个机器学习阶段大致经历了这样一个流程:
(原始数据–>数据清洗(形成特征)–>数据预处理–>特征工程–>进入到模型进行训练)

关于数据清洗,他与数据预处理的界限其实很模糊。很多时候甚至分不清彼此。因此,有不少资料甚至直接把这两个混为一谈。具体是什么,直接看看这个文章:数据清洗

​在基本处理的过程中,numpy,pandas等就派上了用场&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值