【问题描述】
两个类型关系型数据库的csv文件,比如说产品表和分类表,现在这两个文件不是我们能控制的,只有两个文件,需要自己去整合,
那么使用sdbimprt导入工具,如何将这两个不同结构的csv文件能按条件整合导入到sdb的一个表中呢? 【解决办法】
1.先使用sdbimprt导入工具将两个csv文件导入到sequoiadb的A、B表中,再使用sparksql关联sequoiadb,并通过sparksql将A、B表的数据按照条件整合到sequoiadb中新建的表C中,如:insert into C select ... from A left join B on ... where ...
【详情参考】
SparkSQL: http://doc.sequoiadb.com/cn/SequoiaDB-cat_id-1432190712-edition_id-0
数据导入工具: http://doc.sequoiadb.com/cn/index-cat_id-1479195620-edition_id-300
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69935160/viewspace-2652670/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/69935160/viewspace-2652670/