问题描述
当读数据库中的数据,保存为csv时。如果数值型字段的范围过大,在保存为csv用excel、wps打开时会出现精度丢失的问题。
原因是:
Excel显示数字时,如果数字大于12位,它会自动转化为科学计数法;如果数字大于15位,它不仅用于科学计数法表示,还会只保留高15位,其他位都变0。
示例:
id=1585457624919318528 spark中的数据类型为bigint 保存为csv文件会出现下面的情况:
方案尝试:
- 百度的方案:
concat(col_name,'\t') //在字段后加上制表符 这样保存为csv时 该字段就不会保存为常规类型
- 尝试
val df = session.sparkContext.parallelize(List(
("1585457624919318528", "450", "3", "2020-01-13 00:00:05","1666672985169")))
.toDF("id", "salemoney", "saleQty", "