笔记
文章平均质量分 61
yunzailin
数据分析从业者;从事过多年软件实施运维;多年BI项目交付经验,对BI和数据仓库体系认知深刻。
个人发展方向为大数据方向,对数据湖仓和实时数据有浓厚的兴趣;个人对技术和业务的平衡为深入理解技术原理,深入业务需求和实现,即道路为原理支持下的业务实现。
我的分享将是以原理+实现+管理三个模块,对自己以前和以后的经历进行总结和前瞻。
展开
-
Hive随笔
array写入hive原创 2022-07-18 19:50:36 · 379 阅读 · 1 评论 -
Hive实战第一天
hive,大数据原创 2022-04-14 10:47:08 · 1421 阅读 · 0 评论 -
谈谈大数据架构下的存储系统
相信了解过大数据的小伙伴们,对大数据架构的各个组件的名称和大致作用肯定有一定的了解。那我们来看看那些属于存储系统吧 1.hadoop,毫无疑问,它肯定是存储系统,用来存储分布式文件的。从存取速度角度来说,它的速度并不快。从数据量来说,海亮数据存储说的就是以它为鼻祖的组件。他并不擅长存取大量的小文件。适合存储大文件。因为文件的元数据信息保存在namenode的内存中,这个数据结构决定了不能存储太多小文件。 2.hive,它不是存储系统,它是一个基于hadoop的数据仓库,即可以讲存储在hadoop上的结.原创 2021-12-31 22:35:47 · 2082 阅读 · 0 评论