- 博客(2)
- 收藏
- 关注
转载 一种基于SparkSQL的Hive数据仓库拉链表缓慢变化维(SCD2+SCD1)的示例实现
背景 Hive 实现缓慢变化维,没有使用事务表的更新和删除操作(最新版本Hive已经支持,但需要Server/Client做相应配置,Hive实现的事务还有一定的局限性) Hive 自身的SQL使用MapReduce引擎,速度慢,这里使用SparkSQL实现 自动化的SCD引擎待后续实现 参考: https://cwiki.apache.org/confluence/display...
2019-08-06 17:19:00 286
转载 MongoDB Python官方驱动 PyMongo 的简单封装
最近,需要使用 Python 对 MongodB 做一些简单的操作,不想使用各种繁重的框架。出于可重用性的考虑,想对 MongoDB Python 官方驱动 PyMongo 做下简单封装,百度一如既往的未能给我一个满意的结果,于是有了下文。 【正文】 PyMongo,MongoDB Python官方驱动 docs: https://api.mongodb.com/python/cu...
2019-01-07 09:09:00 120
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人