SS01
1、对接kafka、offset管理
2、调优
3、exactly-once:保证数据植被处理一次
ootb:开箱即用
4、standalone:主从
有主节点的,就得做高可用
但是on yarn就不用
5、ss里对接socket数据源,缓存策略是什么 socketTextStream类
memory_and_disk_ser_2
SS02
SS04
1、面试时,对接kafka,一定要说用到0.8和0.10,都用到
2、kafka 的partition和ss 的partition是一一对应的
调优时,假设kafka的topic的partition只有10个,那ss的partition也只有10个,此时给他大于10个core也没用,用不上。