- infa中些的纯sql是运行在数据库中的不是在infa中运行
- 在有过滤的情况下,尽可能的先把数据过滤掉,这样可以提高效率
- tempdb是join等使用的时候,db产生的一个临时表
- 有些功能infa能实现的db也是可以实现的,具体放到哪一个部分去实现。要具体情况具体分析。效率也是相仿的,比如sorter这个和db的效率是没有什么区别的。可以大胆使用。
- infa组件的分类
- Passive transformation 数据行数不改变。比如expression transformation,被动组件
- Active transformation 数据行数发生改变。比如Aggregator,filter,source qualifier