自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 学习项目笔记

create table if not exists lj.tb_4 comment '发送消息条数最多的Top10用户'create table if not exists lj.tb_3 comment '今日发送消息人数、接收消息人数'CREATE TABLE IF NOT EXISTS lj.tb_9 comment '每日按性别统计的发件人消息量'CREATE TABLE IF NOT EXISTS lj.tb_10 COMMENT '每日按消息类型统计的消息量'

2024-04-25 20:10:26 443

原创 【无标题】

数据仓库主要特征: 面向主题的(Subject-Oriented )、集成的(Integrated)、非易失的(Non-Volatile)和时变的(Time-Variant )要注意:('EXTERNAL'='FALSE') 或 ('EXTERNAL'='TRUE')为固定写法,区分大小写!分析型数据库(OLAP),分析型数据库有Doris、StarRocks。仅仅是删除元数据(表的信息),不会删除数据本身。、数据仓库层(DW)、数据应用层(DA)。强制删除数据库,包含数据库下面的表一起删除。

2024-04-24 21:12:23 165

原创 hadoop学习笔记

生产环境中使用Hadoop 3.3.0版本 HDFS的web界面端口号是 9870。生产环境中使用Hadoop 3.3.0版本 HDFS的web界面端口号是 9870。在linux系统中,在终端中输入并执行命令时,这些命令实际上是shell命令。Hadoop 3.0及以上版本 HDFS的web界面端口号是 9870。Hive是hadoop的一个工具,基于hadoop去实现的。比如现在有一个文件,鼠标右键属性,属性里面有很多信息,核心信息,文件位置,大小,所有权,描述数据的称为元数据。

2024-04-23 21:05:22 238 2

原创 大数据与Hadoop

概念:所谓集群是指一组独立的计算机系统构成的一多处理器系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作(服务),可以是并行的,也可以是做备份。概念:分布式是指将多台服务器集中在一起,每台服务器都实现总体中的不同业务,做不同的事情。大数据的核心工作其实就是:从海量的高增长、多类别、低信息密度的数据中挖掘出高质量的结果。分布式 :分布式的主要工作是分解任务,将职能拆解,多个人在一起做不同的事。大数据框架,大多数的基础架构上,都是符合:中心化模式的。大数据的特征:体积、种类、价值、速度、质量。

2024-04-22 21:13:22 323 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除