数据分析一般流程

本文详细介绍了数据分析的一般流程,从定义实际问题、数据收集到信息提炼和行动决策。数据预处理涉及缺失值填补、数据变换、有偏分布、离群点处理、共线性和稀疏变量等问题。通过数据准备、处理、建模和评估,最终将数据转化为有价值的行动建议。此外,文章还讨论了R包在数据分析中的应用。
摘要由CSDN通过智能技术生成

数据分析的一般流程介绍

数据分析的真正价值在于发现问题,解决问题,创造价值。使用什么软件、工具并不是重要。现在市面上的出现的好多机构,解决的更多的是入门使用工具的问题,演变成手段问题。
数据分析是把现实的问题转化为数据能够解决的问题,使用我们学习到的知识和经验,将数据提炼出来的信息应用,创造价值的过程。

分为三部:
从问题到数据,数据到信息,信息到行动。

  1. 问题到数据:[5-15%]
    • 准确定义实际问题
    • 评估当前状况
    • 确定数据挖掘的目标
    • 制定项目计划
  2. 数据到信息
    数据准备[10-15%]
    • 收集数据
    • 描述数据
    • 初步探索变量关系
      数据处理[45-55%]
    • 数据处理
    • 数据变换
    • 变量选择
      建模 [5-15%]
      模型评估[5-10%]
  3. 模型应用[10-15%]
    • 结果交流展示
    • 行动计划
    • 模型监测维护
    • 项目评估反馈

从问题到数据

(准确定义实际问题,评估当前状况,确定数据挖掘目标,制定项目计划)

谁是你的客户? 你知道你的客户嘛,你要怎么与他们交流?
你能把问题具体化嘛?
理解你的客户的问题

问题1:如何提高产品销售量?
问题2:今年年初推出的新促销手段是不是提高了先锋先玉696玉米种子在西南地区的销售量?

  • 这个问题够不够具体化?

  • 类别:比较,描述,聚类,判别还是回归
    回归问题

  • 需要什么样的数据?
    现有数据?数据质量?需要收集什么数据?自变量,因变量

问题3:
某服装公司:要通过精准营销提高效率?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值