数据分析概论

1、数据分析方向:现状分析、原因分析、预测分析

离线数据:对历史数据进行批处理(eg:一周一次)

实时数据:流处理(毫秒级)

预测数据:机器学习(分类、聚类、关联、预测)

2、数据分析思路

  1. 明确分析目的和分析思路
  2. 数据收集:业务数据RDBMS、日志数据(服务器、应用日志)、爬虫数据、互联网公开数据
  3. 数据处理:数据清洗、数据转化、数据提取、数据计算变成结构化数据
  4. 数据分析:用户行为理论、PEST分析法(政治/经济/社会/科技)、5W2H分析法
  5. 数据展现:数据可视化
  6. 报告撰写:对分析结果进行总结

3、大数据5V特征

  1. Velocity:数据增长快、获取数据速度快、数据处理速度快
  2. Value:低密度价值,需要从海量数据中挖掘价值
  3. Veracity:数据质量,数据准确可信
  4. Variety:种类来源多样化,文字图片音频
  5. Volume:数据体量大TB级别

4、分布式和集群

  • 分布式:多台机器(服务旗),每台机器上部署不同的组件,不同组件相互作用。               
  • 分布式存储、分布式计算

  • 集群:多台机器,每台机器上部署相同的组件,比如百度在不同的地方部署相同的搜索服务器

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值