自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 第四模块:Hive

Hive Hadoop在分布式数据处理中遇到的问题 MR开发调试复杂,不适合要求快速得出结果的场景。 Hadoop由Java开发,对JAVA支持最好,对其他语言的使用者不够友好。 需要对Hadoop底层具有一定的了解,并且熟悉API才能开发出优秀的MR程序。 概述 Hive是一个建立在Hadoop基础之上的数据仓库工具,以HiveQL(类SQL)的操作方式让我们能够轻松的实现分布式的海量离线数据处理。而不必去编写调试繁琐的MR程序。 优点: 避免了MR繁琐的开发调试过程,Hive自动将我们输入的HQL编译为

2021-08-24 17:03:02 199

原创 大数据简介

1 大数据 1.1 什么是大数据 大数据就是海量数据的处理。 1.2 为什么要学习大数据 1.3 课程设计 1.4 大数据相关技术 1.4.1 海量数据获取 1.4.2 海量数据存储 1.4.3 海量数据处理 2 网站日志分析系统 2.1 数据收集:JS埋点 2.1.1 前端页面如何将数据发送到后端系统? 2.1.2 在哪里发起Get请求? 2.2 系统架构设计 2.3 八个重要指标 2.4 项目搭建 2.4.1 JS 2.4.2 Log4j 2.4.3 Servlet 2.5

2021-08-12 17:26:58 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除