机器学习- 特征工程概述与意义&基本数据处理 原理

机器学习特征工程

1特征工程概述与意义

    1.1特征工程与意义

         特征 :数据中抽取出来对结果预测有用的信息

         特征工程是使用专业背景知识和技巧处理数据 使得特征能在机器学习算法上发挥更好的作用的过程

         意义 更好的特征意味着更强的灵活度 只需要简单的模型 更好的结果

     1.2工业界的机器学习建模

        实际上 

                跑数据 各种map-reduce hive SQL  数据仓库搬砖

                数据清洗 数据清洗 数据清洗

                分析业务 分析case 找特征 找特征

                简单可解释性好的模型为主 甚至一招LR 打天下

                往往数据特征 决定预测的上限  模型(算法)是帮助我们来逼近这个上限的 所以数据有很大的重要程度

               特征工程的流程是 

                计算机不能直接识别处理的原始数据(Raw data)如数据库,日志文件,文本,语音,图片等。

                通过人物的特征处理
</

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值