1、使用spark统计worldcount
val words = lines.flatMap(line => line.split(" "))
val pairs = words.map(word => (word, 1))
val wordCounts = pairs.reduceByKey(_ + _)
2、什么是clickhouse,优势是什么
clickhouse是列式存储关系里系统,专门用于高性能数据分析和数据仓库应用。是一个开源的数据库系统。
val words = lines.flatMap(line => line.split(" "))
val pairs = words.map(word => (word, 1))
val wordCounts = pairs.reduceByKey(_ + _)
clickhouse是列式存储关系里系统,专门用于高性能数据分析和数据仓库应用。是一个开源的数据库系统。