- 博客(4)
- 收藏
- 关注
原创 大数据实践学习第三天
创建hive基础表的时候,默认的数据间分隔符是:\001(^A)是一种特殊字符,是ASCII值 在Notepad++文本编辑器中是显示为SOH的。没有专门的临时数据库(ODS),这意味着数据会立即加载到单 一的集中存储库中,数据在数据仓库系统中直接进行转换,然后进行分析。),叫联机事务处理OLTP,也可以称面向用户交易的 处理系统,它是针对具体业务在数据库联机的日常操区别作,通常进行增删改查操作。:也称为细节层,DW层的数据应该是一致的、准确的、干 净的数据,即对源系统数据进行了清洗(去除了杂质后的数据。
2024-04-24 21:47:31
436
原创 大数据实践学习第二天
通过对Hadoop集群和Apache Hive的学习,知道了Apache Hive、MySQL和Hadoop之间的联系,也学会了如何使用Shell命令来对数据进行操作,明确了大数据行业知识的广泛性,在以后的学习中还需要更加努力的学习,提升自己的能力。
2024-04-23 21:35:33
933
2
原创 Hadoop入门知识
Hadoop是Apache软件基金会下的顶级开源项目,用以提供:• 分布式数据存储• 分布式数据计算• 分布式资源调度为一体的整体解决方案。
2024-04-22 23:16:36
614
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人