大数据分析需注意哪些问题

在信息时代,大数据成为重要生产要素。提高大数据分析效果的关键包括深入理解业务、准备样本数据、选择有价值的变量、进行模型训练及发布。企业应注重业务需求调查、数据基础和应用基础,不断优化模型,实现大数据价值最大化。
摘要由CSDN通过智能技术生成

  信息时代,数据俨然已成为一种重要的生产要素,如同资本、劳动力和原材料等其他要素一样,而且作为一种普遍需求,它也不再局限于某些特殊行业的应用。在提高大数据分析效果方面我们都需要注意的问题都欧哪些。

大数据分析需注意哪些问题

 

  提高大数据分析效果的常用方法分享:

 

  1、业务分析:对于业务的理解能力越强,选择的数据和变量就越有价值,这是机器学习的要点,当然极个别的场景除外,比如下棋。

 

  大多数企业机器学习的应用场景涉及的要素基本是无法穷尽的,因此,越复杂的环境,就越需要强大的业务理解能力,现在只有人有这个能力。

 

  2、样本数据准备:大多时候,我们需要从数据仓库(当然数据库,文件都可以)获取所需的样本数据,数据仓库的效率起到至关重要的作用,比如数据预处理,这个阶段往往耗费了大量的时间。

 

  3、变量选择:业务分析虽然能大致圈定一些变量,但有时还是需要依赖一些更为客观的评价方法,比如IV,WOE等等,甚至需要单独建个模型来取舍变量,这个过程往往是独立的。

 

  4、样本数据输入:需要根据变量选择的结果决定样本的终数据,作为模型训练的数据输入。

 

  5、模型训练:需要选择合适的数据挖掘引擎和算法(深度学习或者机器学习等等),无论是基于图形界面或是脚本;需要将样本数据输入到挖掘引擎中,无

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值