Mac下utf-8编码转换问题

本文介绍了如何在Mac环境下将Excel文件的每一行导出为TXT,并使用enca工具解决由编码问题导致的无法打开TXT文件的问题。通过VBA脚本将Excel转换为TXT,然后利用enca进行GBK到UTF-8的转换。
摘要由CSDN通过智能技术生成

文章分为两部分内容:1.excel每一行到处为txt 2.用enca转换utf-8

excel每一行导出为txt

背景:最近在做智库项目,爬取了高校很多教师信息,经过预处理后保存为excel文件,由于要将每个老师的信息做jieba分词和去停用词,因此先将excel每一行转成一个txt文本,借助excel的VBA对每一行转成txt,参考百度经验

  1. 打开原文件:
    在这里插入图片描述
  2. Alt+F11,(mac是option+fn+f11 )打开VBA,在左侧找到你要导的表,左键双击输入指令
  3. 复制以下代码进去就ok了
Sub txt()  
Dim i, j, arr(), brr(), myRow, myCol  
arr = Sheet1.UsedRange   
myRow = UBound(arr, 1)  
myCol = UBound(arr, 2)   
For i = 1 To myRow    
Open ThisWorkbook.Path & "\" & arr(i, 1) & "1.txt" For Output As #1 
Print #1, Join(Application.Index(arr, 1), ",")  
Print #1, Join(Application.Index(arr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值