把一些想法整理到了ppt里面:
1. 主要是sql如何可以在Map-Reduce框架下面完成分布化:可能需要解析成map-phrase sql和reduce-phrase sql
2. PG如何修改analyse_rewrite和planner接口
3. 如何整合hadoop和pg
都是按照最少开发量的设计,对性能效率没有过多的考虑,目的是尽量的sql兼容,而不是像hive和pig那样搞一套新的sql语法
ppt地址:http://pgfoundry.org/docman/view.php/1000407/13447/hadoop%20and%20pg%20.ppt