大数据
文章平均质量分 87
Charlee1118
这个作者很懒,什么都没留下…
展开
-
Hive基础
1. 启动beeline,/export/server/hive/bin/beeline。创建数据库(可以用schema表示数据库)ETL和ELT(将数据加载到数仓中)数据对象:数据库、数据表、视图、索引。DDL:数据定义语言/数据描述语言。配置环境变量,快速启动hive。datagrip连接hive。3. crtl+d 退出。1. 创建:create。数据库和数据仓库的区别。3. 修改:alter。2. 删除:drop。4. 不涉及表内操作。原创 2023-09-11 22:19:38 · 72 阅读 · 0 评论 -
Hive SQL基础
外部表(EXTERNAL_TABLE):关联表,需要搭配location。内部表(MANAGED_TABLE):默认创建内部表,托管表,管理表。不建议修改表的存储路径地址,因此修改表路径仅作了解。上传文件映射表:通过HDFS网页上传到对应目录。当仅临时使用数据时,使用外部表,建议使用内部表。添加external,则创建的是外部表。原创 2023-09-11 22:25:11 · 82 阅读 · 0 评论 -
hadoop基础
2. 分布式系统:一个硬件或软件,其组件会分布在不同的计算机上,并可以通过网络进行通信和协调。多台不同服务器部署相同的应用或服务模块。1. 分布式数据存储:HDFS。MapReduce(分而治之)HDFS上使用shell命令。Hadoop目录结构。原创 2023-09-11 22:09:53 · 54 阅读 · 0 评论