把Kaggle上的.csv数据集翻译为中文

首先来看看待翻译的.csv数据集:
这是用excel打开的样子
在这里插入图片描述
这是用记事本打开的样子
在这里插入图片描述
这里我直接用的搜狗翻译,因为可以直接上传.csv文件,翻译完之后会返回.xlsx文件
这是用excel打开的样子
在这里插入图片描述
乍一看没毛病,但是一放到程序里运行就报错了,用记事本打开发现乱码了
在这里插入图片描述
网上查了许多办法,包括用记事本打开,更换编码格式然后再另存为一个新文件,直接改成.csv后缀名……都不行
千辛万苦的尝试下,终于找到了解决方案
第一步,用excel打开文件,点击左上角文件
在这里插入图片描述
第二步,点击另存为
在这里插入图片描述
第三步,确定好保存路径后,下拉保存类型,选择CSV UTF-8保存
在这里插入图片描述
最后再用记事本打开,发现没有乱码了,但是新的问题出现了,每行末尾多出了许多,不过,好歹文本能正常显示了,下一步就是如何把每一行末尾的全部取出,为此,我写了一个简单的python程序,代码如下:

if __name__ == '__main__':
    with open('excel译文.csv', 'r',encoding='utf-8') as f,open("result.csv",'a',encoding='utf-8')as file:
        while True:
            out = f.readline().strip()
            n = len(out)
            # new_out = out.replace("," , "+++")
            count = 0
            for i in range(n - 1, -1, -1):
                if (out[i] == ","):
                    count += 1
                else:
                    break
            new_s = out[0:n - count]
            if not out:
                break
            file.write(new_s+"\n")
            print(new_s)

翻译完之后将结果存在result.csv里边
最后再用记事本打开这个文件,大功告成!
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值