自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 数仓和hive实操

数仓(Data Warehouse)是指在企业内部建立的一个用于集中存储和管理各种数据的仓库,包括来自不同业务系统和数据源的数据。数仓的目的是为了支持企业的决策制定和业务分析,通过对数据的整合、清洗、加工和分析,提供高质量、一致性和可信度的数据,帮助企业更好地理解业务情况、发现潜在机会和挑战,并做出科学的决策。数仓通常包括数据提取、数据转换、数据加载等过程,将各个数据源的数据整合到一个统一的数据仓库中,提供给企业内部的决策者和分析师使用。

2024-04-24 21:44:37 246 3

原创 常用的shell命令和sql语句(希望老师上课别cue我)

这些是一些常用的HDFS Shell命令,可以帮助用户管理和操作HDFS文件系统。您可以通过运行"hdfs dfs -help"命令来查看更多关于HDFS Shell命令的详细信息。

2024-04-23 20:53:56 292

原创 hadoop入门

Hadoop指Apache这款开源框架,它的核心组件有: ➢ HDFS(分布式文件系统):解决海量数据存储 ➢ MAPREDUCE(分布式运算编程框架):解决海量数据计算 ➢ YARN(作业调度和集群资源管理的框架):解决资源任务调度。

2024-04-22 21:46:47 448

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除