之前总听人说 现在哪个牛逼的互联网公司 对于处理海量的数据的解决方案 都不是用oracle或者mysql这种常规的关系型DB.
而是用hadoop/spark/flink之类的新型分布式数据存储和计算引擎
近来因为工作原因 有机会接触了一点点Hive在实际工作中的应用 并亲手撸了几把代码
最直观的感受就是----快.
对于百万/千万甚至亿级别的数据量来说 hive操作确实很快 比mysql好很多
对于开发人员而言 Hive真的很像很像关系型DB里的存储过程 如果你之前熟悉存储过程 那上手hive 基本也就是2 3天的问题.
所以牛逼的不是你能掌握什么技术的使用 而是你是否有能力建造一个能解决现实问题的新的技术体系.
这不光是对技术能力有更深层次的要求,而且需要有足够的想象和创造能力, 去设想出一个能解决问题的方案,并且实现之.