Excel打开UTF-8编码CSV文件乱码的问题

场景

在阿里云数仓用tunnel download导出来的CSV文件编码格式是UTF-8的,用Excel打开时就会出现乱码的情况。

方法1:数据导入

  1. 新建空Excel文档并打开
  2. 执行“数据”->“自文本”,
  3. 选择 CSV 文件,出现文本导入向导,
  4. 选择“分隔符号”,
  5. 下一步,勾选“逗号”,去掉“ Tab 键”,
  6. 下一步,完成,在“导入数据”对话框里,直接点确定。

导入之后,所有汉字显示正常,乱码问题解决。

方法2:指定格式导出

-c 指定本地数据文件编码。默认不设定,下载源数据。

下载时指定:tunnel download -c GBK

问题产生的原因

excel打开文件时默认使用unicode的编码方式(还有的网友说是默认以ANSI编码方式打开,待考)。在Unicode基本多文种平面定义的字符(无论是拉丁字母、汉字或其他文字或符号),一律使用2字节储存。恰恰utf-8是1字节的存储方式,所以excel直接打开时会出现乱

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值