- 博客(4)
- 资源 (11)
- 收藏
- 关注
原创 大数据的仓库Hive原理(三)
上次我们简单说了一下Hive的工作原理,今天我们来深入看一下它是如何把Hql语句转换为m/r来运行的。 我们从认识Hive到理解它的运行原理,已经对其有了一定的了解。当然在实际应用中还会遇到各种问题,只要我们坚持去做,就没有什么做不到的。
2016-06-29 18:31:52 2328 1
原创 大数据的仓库Hive原理(二)
上次我们说到了大数据应用中的数据仓库hive,我们知道了利用hive可以更方便的处理数据,而且它的扩展性、延展性和容错性都比较好,但是它是如何利用Hql(类Sql语句)来实现数据处理的呢。 我们从hive的简单介绍到它优缺点的理解,以及它与传统关系型数据库的区别都做了一些学习,今天我们又对它的原理做了一些简单的认识,下次我们继续深入解析hive的工作原理。
2016-06-29 09:20:17 1683
原创 大数据的仓库Hive学习(一)
我们接着之前学习的大数据来学习。之前说到了NoSql的HBase数据库以及Hadoop中的HDFS存储系统,可是我们发现这跟我们平时常用的关系型数据库有很大区别,为了使用方便,产生了针对大数据存储的数据仓库Hive。 今天我们通过对Hive的学习,对大数据的处理又有了一定的认识。在以后的实际操作中,我们去慢慢掌握Hive的使用方法。通过不断学习,达到自己所追求的目标。
2016-06-20 14:58:25 4548
原创 用索引来实现幂等
随着大数据的到来,分布式处理变得越来越火,而且分布式中的一致性事务又是重中之重。当然我们今天的重点不在于介绍如何保证分布式事务中的一致性,而是在保证事务一致性的过程中会出现一系列的补偿机制,这就涉及到了幂等。接下来让我们一起去看一下吧。 我们了解了索引之后就能实现幂等了,从而可以避免重复插入。这在电商或者其他的项目中,处理重复的订单就简单多了。当然,这只是其中的一种方法,其他的方法以后遇到再与大家分享。
2016-06-17 11:25:37 1942 1
[免费]从Paxos到Zookeeper分布式一致性原理与实践.pdf
2017-09-04
xdoclet-plugins-1.0.3 下载
2016-01-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人