特征抽取-特征处理等的理解

数据类型:       

       离散型数据:记录不同类别个体的数目所得到的数据又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他的精确度。

        连续型数据:变量可以在某个范围内取任一数即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是整数,含有小数部分。

注:只要记住一点,离散型是区间内不可分,连续型是区间内可分

特征抽取:

特征抽取针对非连续型数据

特征抽取对文本等进行特征值化

注:特征值化是为了计算机更好的去理解数据

特征处理:

特征处理的重要性:     确保每个特征都对结果的影响程度相同

通过特定的方法将数据转化为算法要求的数据

        包含:归一化:

                   标准化:

注:一般用标准化对数据进行特征处理,标准化相比归一化具有能减小异常值对结果的影响

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值