- 博客(2)
- 资源 (4)
- 收藏
- 关注
转载 60 TB 数据:Facebook 是如何大规模使用 Apache Spark 的
Facebook 经常使用数据驱动的分析方法来做决策。在过去的几年,用户和产品的增长已经需要我们的分析工程师一次查询就要操作数十 TB 大小的数据集。我们的一些批量分析执行在古老的 Hive 平台( Apache Hive 由 Facebook 贡献于 2009 年)和 Corona 上——这是我们定制的 MapReduce 实现。Facebook 还不断增加其对 Presto 的用量,用
2017-07-04 19:28:04
661
原创 Hive中文注释乱码问题的解决
Hive中文注释乱码问题的解决标签: hive中文注释乱码在Hive中建表的时候,有时候难免要表中文注释,然而如果不经过配置,会导致desc某个表名的时候,直接以?的方式返回。因此也来解决一下hive中文注释乱码的问题。由于HIVE的元数据是存在于MySQL上的,因此需要在mysql上进行元数据的候。因此也来解决一下这个问题。当hiv
2017-07-03 11:26:25
2199
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人