自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 day8-案例聊天数据分析报表

​ 聊天平台每天都会有大量的用户在线,会出现大量的聊天数据,通过对,可以更好的对用户构建用户画像,为用户提供更好的服务以及实现平台运营推广,给公司的发展决策提供精确的数据支撑。项目目标:​ 基于HadoopHive和FineBI实现聊天数据统计分析,构建(如下图)

2024-09-17 09:58:03 1625

原创 day7-Hive复杂数据类型

day7-Hive集合数据类型一、Array 数组类型参考数据namework_locationszhangshanbeijing,shanghai,tianjin,hangzhouwangwuchangchun,chendu,wuhan,nanchang格式array<类型>collection items terminated by '分隔符';创建包含数组的表-- 创建表,两个字段(名字、工作地点)create tabl

2024-09-15 21:15:25 605

原创 day06-Hive函数补充

使用函数对字段数据进行处理计算不同类型的字段数据有不同的处理函数。

2024-09-14 20:34:36 938

原创 day05-Hive语法补充

表名和字段的修改使用alter关键字。

2024-09-13 18:36:33 1670 2

原创 day04-HiveSQL

数据1-2 结构化数据1-3 映射表二、Hive架构

2024-09-13 08:00:00 796

原创 day03-Hadoop框架

集群:指一组独立的计算机系统构成的一多处理器系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作(服务),可以是并行的,也可以是做备份。单机安装将服务安装到一台服务器上集群安装将服务器安装到多台服务器上(👇图为集群示例)分布式和集群区别分布式主要工作是分解任务,将职能拆解,多个人在一起做不同的事集群主要是将同一个业务,部署在多个服务器上 ,多个人在一起做同样的事Hadoop是Apache旗下的一个用Java语言实现开源软件框架,是一个存储和计算大规模数据。

2024-09-12 20:07:52 885

原创 day02-Linux系统操作

Linux常见命令汇集(有图片版)

2024-09-12 10:00:00 1251

原创 C盘空间突然变小了的可能原因

链接:https://pan.baidu.com/s/12WLpIThatfY1g9fvKjBtaw?)又出现了,关掉对系统没多大影响。

2024-09-11 23:39:51 188

原创 day01-大数据概述

大数据(big data):无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合大数据的数据量:1PB~1EB <=> 1024TB~1024*1024TB大数据技术的任务:解决和。

2024-09-11 20:14:43 1226

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除