工作用遇到hive查询中sum数据精度丢失问题。
问题描述:公司大数据组把线上数据库表的类型简单粗暴的设置为string类型了,我在hive上做算数运算时精度丢失。
处理方案:使用cast(table.column_name as decimal(38,2)) 将string类型转换成decimal(38,2)为保留两位小数。
另外还使用了下regexp正则。
case when orders.name regexp '\\d+秀点' then '秀点'
else orders.name end