需求:表1和表2不在同一物理机上,将表2中的有的表1中没有的数据插入表1中,在表1有的数据不做更新操作
1.表1原数据
2.表2原数据
3.表1和表2join后数据
4.处理后数据
kettle实现
就使用插入/更新组件就能实现(插入/更新插入在数据量很大时不建议使用,此组件的效率很低,当需要插入更新时,使用先删除再插入,效率会很高)
我这使用了,是因为数据量小,解决一次性的问题,如下图在update列全部选上N即可
需求:表1和表2不在同一物理机上,将表2中的有的表1中没有的数据插入表1中,在表1有的数据不做更新操作
1.表1原数据
2.表2原数据
3.表1和表2join后数据
4.处理后数据
kettle实现
就使用插入/更新组件就能实现(插入/更新插入在数据量很大时不建议使用,此组件的效率很低,当需要插入更新时,使用先删除再插入,效率会很高)
我这使用了,是因为数据量小,解决一次性的问题,如下图在update列全部选上N即可