大数据Spark “蘑菇云”行动第59课: 广告点击系统TopN热门广告分析与实现
两份全局累计数据:一份在SparkStreaming中,另外一份在MySQL
计算TOPn:1、topn从数据库中计算,数据特别多,一台数据库装不完,效率不高。不采用。
2、直接从spark streaming中累加器 reducebykey
大数据Spark “蘑菇云”行动第59课: 广告点击系统TopN热门广告分析与实现
两份全局累计数据:一份在SparkStreaming中,另外一份在MySQL
计算TOPn:1、topn从数据库中计算,数据特别多,一台数据库装不完,效率不高。不采用。
2、直接从spark streaming中累加器 reducebykey