大数据专题(一)- 简介

一、什么是大数据
在互联网技术发展到至今阶段,大量日常,工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的技术应运而生,这就是发数据技术。

梳理海量数据的核心技术:

  • 海量数据的储存(分布式)
  • 海量数据的运算(分布式)

这些核心技术的实现是不需要用户从零开始造轮子的储存和运算的都已经有大量的承受的框架来用。

储存框架:

  • HDFS–分布式文件储存系统
  • HBase–分布式数据库系统
  • Kafka – 分布式消息缓存系统(实时流式数据处理场景中应用广泛)

运算框架:(要解决的核心问题就是帮用户将处理逻辑在许多机器上并行执行)

  • Hive – 数据仓库工具:可以接收SQL,翻译成mapreduce或者spark程序运行
  • Flume – 数据采集
  • Sqoop – 数据迁移
  • Elisticsearch – 分布式的搜索引擎

    换个角度说,大数据是:
  1. 有海量的数据
  2. 有海量的数据进行挖掘的需求,有对海量数据进行挖掘的工具(Hadoop、spark等)

大数据在现实生活中的具体应用

数据处理测最典型应用:公司的产品运营情况分析
电商推荐系统:基于海量的浏览行为,购物行为数据,进行大量的模型的运算,得出各种推荐结论,一共电商网站页面来为用户进行商品推荐,(猜你喜欢)

精准广告推送系统:基于海量的互联网用户的各类数据,统计分析,进行用户画像(得到用户的各种属性标签),然后可以为广告主进行有针对性的进准的广告投放。

  • 35
    点赞
  • 137
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值