数据分析需要掌握的基础知识

数据分析需要掌握的基础知识总结

目前说到数据建模,数据挖掘,大数据分析,就会比较偏向技术,大多数聊的内容都是一些模型的技术实现,需要用到的技术。但是后来发现更多的还是要理解我们数学上统计学的概念,和一些基本方法。
更重要的还是要做数据模型挖掘这个领域的业务知识,只要熟知相关领域的业务知识才能利用技术解决业务上的一些问题。
我这里忽略的还是基本工具的使用,在大数据分析,数据挖掘这项技术普及之前,我们还是要掌握我们常用的一些普遍工具的使用。
有些问题不用上升到需要建模型的程度,一些很普遍的工具用起来更方便,更快捷,也更好理解。

  1. 统计学的一些基本概念
  2. 业务知识的学习
  3. 基础工具的使用-Excel
  4. 数据分析的一般方式
  5. 数据分析后的可视化
  6. 对数据的总结报告

异常值的处理办法(离群点)

异常值在我们的数据中是指有些数据和我们其他数据差别很大的个别数据。
比方说可能录错的数据,或者极个别正确但和其他数据差距很大的数据,如工资多数人1万。个别人10万。这种情况,我们做的处理有:

  1. 删除-删除那些我们没办法补充和修改的离群点数据。
  2. 修改-修改那些错误数据-前提是你确实知道正确的数据
  3. 用样本的平均值进行填充
    我理解的这几个方面还是要保证数据样本的准确性,只有这样使用模型计算出来的结果才能更准确,才更有参考价值。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值