1.权重采样:
权重weight越大,采样的频率越高
pow(rand(), 1/(weight+0.01))
2.hive 增加字段和删除字段
增加字段示例:
一次增加一个列(默认添加为最后一列)
ALTER TABLE table ADD COLUMNS (new_col int);
删除示例:
原有Hive表table_test中有a,b,c,d,e这几个字段
将从table_test中删除“d”列:
ALTER TABLE table_testREPLACE COLUMNS (a int, b int,c string,e string);
将d和e两列一起删除:
ALTER TABLE table_testREPLACE COLUMNS (a int, b int,c string);