特征工程
qq_16608563
这个作者很懒,什么都没留下…
展开
-
机器学习特征工程读书笔记-前言
简介 特征工程处于哪个步骤呢? 我觉得整个机器学习流程主要可以分为 数据采集、数据探索、数据预处理、建模、模型分析与优化和部署使用。 特征工程大概位于数据预处理和建模之间,特征工程与数据预处理是有交叉的,为啥这么说呢?往下看 一般来说,我们采集的数据时无法直接用于建模的,其中可能含有一些脏数据,比如缺失值、异常值或者不一致的值,这些脏数据可以通过数据探索和数据预处理来进行处理的。 但是经过数据预处...原创 2019-09-27 09:52:03 · 113 阅读 · 0 评论 -
机器学习流程
几个基本概念 数据 数据时对现实世界的现象的观测 任务 收集数据的目的是因为有些问题需要靠数据找出答案 由数据得到答案的过程有着复杂的路径,但是这个过程包括两个构成机器学习基础的数学实体:模型 和 特征 模型 数据的数学模型描述了数据不同部分之间的关系。 例如股票价格的模型可以是一个公式,它将公司的收入历史、过去的股票价格和行业映射为预测的股票价格。 数学公式将数值型的变量联系起来,但原始数据经常...原创 2019-09-27 09:52:29 · 228 阅读 · 0 评论 -
简单而又奇妙的数值
引言 尽管数值型数据已经很容易被数学模型所使用,但并不意味着不需要进行特征工程。 好的特征不仅能够表示出数据的主要特点,还应该符合模型的假设,因此通常必须进行数据转换。 数值型数据的特征工程技术是非常基本的,只要原始数据被转换为数值型特征,就可以应用这些技术。 1: 需要对数值型数据进行合理性检查,首先要看看它的量级。 2: 然后,还要考虑一下特征的尺度。 它的最大值和最小值是多少?是否横跨多个数...原创 2019-10-08 10:55:42 · 303 阅读 · 0 评论