select code,
sort_array(collect_set(
concat(
"{",
concat(
concat("\"", p_old, "\""),
":",
concat("\"", p_old_s, "\"")
),
"}"
)
)) as year_s_set
from a group by code;
使用了hive中的3个函数,concat、collect_set、sort_array
1、cancat 可以将多个字符串连接
2、collect_set 可以将分组后的数据一条一条收集成一个array,而且会去除重复数据
3、sort_array 可以对一个array中的所有元素进行字典序排序