- 博客(3)
- 收藏
- 关注
原创 数仓和hive实操
数仓(Data Warehouse)是指在企业内部建立的一个用于集中存储和管理各种数据的仓库,包括来自不同业务系统和数据源的数据。数仓的目的是为了支持企业的决策制定和业务分析,通过对数据的整合、清洗、加工和分析,提供高质量、一致性和可信度的数据,帮助企业更好地理解业务情况、发现潜在机会和挑战,并做出科学的决策。数仓通常包括数据提取、数据转换、数据加载等过程,将各个数据源的数据整合到一个统一的数据仓库中,提供给企业内部的决策者和分析师使用。
2024-04-24 21:44:37 246 3
原创 常用的shell命令和sql语句(希望老师上课别cue我)
这些是一些常用的HDFS Shell命令,可以帮助用户管理和操作HDFS文件系统。您可以通过运行"hdfs dfs -help"命令来查看更多关于HDFS Shell命令的详细信息。
2024-04-23 20:53:56 292
原创 hadoop入门
Hadoop指Apache这款开源框架,它的核心组件有: ➢ HDFS(分布式文件系统):解决海量数据存储 ➢ MAPREDUCE(分布式运算编程框架):解决海量数据计算 ➢ YARN(作业调度和集群资源管理的框架):解决资源任务调度。
2024-04-22 21:46:47 448
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人