- 博客(4)
- 收藏
- 关注
原创 学习项目笔记
create table if not exists lj.tb_4 comment '发送消息条数最多的Top10用户'create table if not exists lj.tb_3 comment '今日发送消息人数、接收消息人数'CREATE TABLE IF NOT EXISTS lj.tb_9 comment '每日按性别统计的发件人消息量'CREATE TABLE IF NOT EXISTS lj.tb_10 COMMENT '每日按消息类型统计的消息量'
2024-04-25 20:10:26 469
原创 【无标题】
数据仓库主要特征: 面向主题的(Subject-Oriented )、集成的(Integrated)、非易失的(Non-Volatile)和时变的(Time-Variant )要注意:('EXTERNAL'='FALSE') 或 ('EXTERNAL'='TRUE')为固定写法,区分大小写!分析型数据库(OLAP),分析型数据库有Doris、StarRocks。仅仅是删除元数据(表的信息),不会删除数据本身。、数据仓库层(DW)、数据应用层(DA)。强制删除数据库,包含数据库下面的表一起删除。
2024-04-24 21:12:23 184
原创 hadoop学习笔记
生产环境中使用Hadoop 3.3.0版本 HDFS的web界面端口号是 9870。生产环境中使用Hadoop 3.3.0版本 HDFS的web界面端口号是 9870。在linux系统中,在终端中输入并执行命令时,这些命令实际上是shell命令。Hadoop 3.0及以上版本 HDFS的web界面端口号是 9870。Hive是hadoop的一个工具,基于hadoop去实现的。比如现在有一个文件,鼠标右键属性,属性里面有很多信息,核心信息,文件位置,大小,所有权,描述数据的称为元数据。
2024-04-23 21:05:22 287 2
原创 大数据与Hadoop
概念:所谓集群是指一组独立的计算机系统构成的一多处理器系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作(服务),可以是并行的,也可以是做备份。概念:分布式是指将多台服务器集中在一起,每台服务器都实现总体中的不同业务,做不同的事情。大数据的核心工作其实就是:从海量的高增长、多类别、低信息密度的数据中挖掘出高质量的结果。分布式 :分布式的主要工作是分解任务,将职能拆解,多个人在一起做不同的事。大数据框架,大多数的基础架构上,都是符合:中心化模式的。大数据的特征:体积、种类、价值、速度、质量。
2024-04-22 21:13:22 350 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人