自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 实习认知笔记day4

-如果数据库已存在就删除 drop database if exists db_msg cascade;--创建数据库 create database db_msg;--切换数据库 use db_msg;数据来源: 聊天业务系统中导出的2021年11月01日一天24小时的用户聊天数据,以TSV文本形式存储在文件中。2.统计每天、每个小时的消息量, 但是数据中没有天和小时字段,只有整体时间字段,不好处理。1.当前数据中,有一些数据的字段为空, 不是合法数据。

2024-04-25 21:23:25 282 1

原创 实习认知笔记day3

操作型处理(数据库),叫联机事务处理OLTP(On-Line Transaction Processing),也可以称面向用户交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常进行增删改查操作。分析型处理(数据仓库),叫联机分析处理OLAP(On-Line Analytical Processing),也可以称为面向专业分析人员进行数据分析,通常进行查询分析操作,一般针对某些主题的历史数据进行分析,支持管理决策。删除外部表:仅仅是删除元数据(表的信息),不会删除数据本身。数据仓库架构可分为三层。

2024-04-24 16:24:59 231

原创 实习认知笔记day2

驱动程序在操作系统和硬件设备之间起到了桥梁的作用,它将操作系统的指令转化为硬件可以理解和执行的命令。1、数据存储与管理:Hive能够将结构化数据存储在Hadoop分布式文件系统(HDFS)中,并提供表、分区、桶等抽象概念,方便管理和组织数据。3、查询与分析:HiveQL查询语言使得用户可以方便地使用SQL语法来执行复杂的查询操作,包括筛选、聚合、连接等,从而实现数据探索和分析。2、数据转换与集成:Hive支持ETL(抽取、转换、加载)操作,可以对原始数据进行清洗、转换和集成,以适应特定的分析需求。

2024-04-23 19:15:08 188 2

原创 实习认知笔记day1

所谓集群是指一组独立的计算机系统构成的一多处理器系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作(服务),可以是并行的,也可以是做备份。去中心化模式,没有明确的中心,众多服务器之间基于特定规则进行同步协调。分布式是指将多台服务器集中在一起,每台服务器都实现总体中的不同业务,做不同的事情。集群主要是将同一个业务,部署在多个服务器上,多个人在一起做同样的事。分布式的主要工作是分解任务,将职能拆解,多个人在一起做不同的事。为一体的整体解决方案。

2024-04-22 20:06:08 151 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除