![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
机器学习相关基础知识
ZD_012
这个作者很懒,什么都没留下…
展开
-
【机器学习】特征工程 —— 特征抽取
特征工程定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。内容:主要有三部分: 1、特征抽取 2、特征预处理 3、数据的降维数据集数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据原创 2020-11-17 15:34:03 · 712 阅读 · 0 评论 -
【机器学习】特征工程—— 特征预处理
特征工程定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。内容:主要有三部分: 1、特征抽取 2、特征预处理 3、数据的降维特征预处理特征预处理:通过特定的统计方法(数学方法)将数据转换成算法要求的数据。1、包含内容数值型数据:标准缩放,包括归一化、标准化、缺失值类别型数据:one—hot编码时间类型:时间的切分2、sklearn特征处理API:sklearn.preprocessing一、归一化1、特点通过对原始原创 2020-11-25 16:33:39 · 479 阅读 · 0 评论 -
【机器学习】特征工程——数据降维
特征工程定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。内容:主要有三部分: 1、特征抽取 2、特征预处理 3、数据的降维数据降维机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的)。f可能是显式的或隐式的、线性原创 2020-11-25 17:00:37 · 582 阅读 · 0 评论 -
【机器学习】机器学习基础
一、机器学习概述1、机器学习算法的判别依据 —— 数据类型离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高它们的精确度。连续型数据:变量可以在某个范围内任取一数,即变量的取值可以是连续的,如长度、时间、质量值等,这类整数通常是非整数,含有小数部分。注:离散型是区间内不可分,连续型是区间内可分。数据的类型将是机器学习模型不同问题不同处理的依据。机器学习算法的分类1、监督学习(预测):可以由输入数据中学到或建立一个模型,原创 2020-12-08 15:56:46 · 299 阅读 · 0 评论