机器学习第三天

特征工程的内容

• 特征提取 :从原始数据中提取与任务相关的特征

特征预处理 :特征对模型产生影响;因量纲问题,有些特征对模型影响大、有些影响小

• 特征降维:将原始数据的维度降低,叫做特征降维

• 特征选择 :把多个的特征合并成一个特征。一般利用乘法或加法来完成

特征预处理

要做到归一化和标准化:

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响 (支配)目标结果,使得一些模型(算法)无法学习到其它的特征

归一化:通过对原始数据进行变换把数据映射到【mi,mx】(默认为[0,1])之间

例子:

           /\                                                        /\

           ||                                                        ||

min和max都是在一列之中做比较】  mi和mx也是

公式:{[(x-min)*(mx-mi)]/(max-min)}+mi

 课堂例子实现:

import numpy as np
from sklearn.preprocessing import MinMaxScaler
def dm01_MinMaxScaler():
    data = [[90, 2, 10, 40],
            [60, 4, 15, 45],
            [75, 3, 13, 46]]
# 2. 初始化归一化对象
    transformer = MinMaxScaler()
# 3. 对原始特征进行变换
    data = transformer.fit_transform(data)
# 4. 打印归一化后的结果
    print(data)
#调用函数
dm01_MinMaxScaler()

结果为

[[1.         0.         0.         0.        ]
 [0.         1.         1.         0.83333333]
 [0.5        0.5        0.6        1.        ]]


 还有一个鸢尾花分类之后会补充

  • 10
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值