Excel乱码解决
场景
在阿里云数仓用tunnel download
导出来的CSV文件编码格式是UTF-8的,用Excel打开时就会出现乱码的情况。
方法1:数据导入
- 新建空Excel文档并打开
- 执行“数据”->“自文本”,
- 选择 CSV 文件,出现文本导入向导,
- 选择“分隔符号”,
- 下一步,勾选“逗号”,去掉“ Tab 键”,
- 下一步,完成,在“导入数据”对话框里,直接点确定。
导入之后,所有汉字显示正常,乱码问题解决。
方法2:指定格式导出
-c 指定本地数据文件编码。默认不设定,下载源数据。
下载时指定:tunnel download -c GBK
问题产生的原因
excel打开文件时默认使用unicode的编码方式(还有的网友说是默认以ANSI编码方式打开,待考)。在Unicode基本多文种平面定义的字符(无论是拉丁字母、汉字或其他文字或符号),一律使用2字节储存。恰恰utf-8是1字节的存储方式,所以excel直接打开时会出现乱