- 博客(2)
- 收藏
- 关注
转载 Hive学习笔记,阿里架构师亲手整理,赶快收藏起来
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。方法:1、运行机制和原理2、动手:安装配置3、写程序Hive: 基于HDFS之上的数据...
2018-06-26 14:17:53 152
原创 提高数据存储效率的七个技巧
IT专业人员经常致力于提高存储性能,以确保应用程序获得他们运行所需的资源。有的企业采用的是硬盘技术,这意味着其使用成本昂贵,并且效率低下,例如在几十个(或是数百个)硬盘上分割数据,然后格式化这些驱动器,只有一半的硬盘容量可用于应用程序。 如今,更为经济的闪存存储器在可预见的未来有望打破存储设备在应用性能上的瓶颈。为了充分利用闪存,人们需要以正确的方式和正确的技术来实现它。这样,就可以从整体的固...
2018-06-14 14:20:04 1202
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人