第一次听到机器学习这个名词的时候,很恍惚,不知道它到底是什么?
我对机器学习的理解
机器学习是什么?
简单的说机器学习就是模仿人的思维处理数据。
例如一份历史数据,我们需要把它训练成为一个模型,当有新的数据时,我们把新的数据输入模型中,以此来预测新数据的属性。
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。
机器学习的工作流程是什么?
获取数据(用户数据)——数据基本处理——特征工程——机器学习(模型训练)——模型评估(结果达到要求,上线服务;结果没达到要求,重新数据基开始本处理)——在线服务
在机器学习中对于数据集的理解
一行数据叫做——样本
一列数据叫做——特征
有的结果有特征值、目标值,有的结果没有目标值,只有特征值。
数据分割
在建立好模型之后,除了要进行模型训练,还要对数据进行测试,验证模型怎么样。
这个行为叫做数据的分割。
机器学习一般将数据集分为:训练集和测试集
测试数据:在模型检验时使用,用于评估模型是否有效
训练数据:用于训