Python读入中文记得要encoding=“utf-8“

用python将中文/汉字写入文本文档或者从文本文档读取中文信息

经常有同学碰到通过python无法将汉字信息写入文本,或者无法读取文本里的汉字信息的情况,读取结果为乱码,下面用一种简单的方式解决这个问题。

写入文本文档:

import os
s='Hello World\n文本文件的中文信息读取\n文本文件中文信息的写入\n'   
f=open('test1.txt','a+',encoding="utf-8") #test1是已经存在于当前目录下的文档
f.write(s)
f.close

读取文本文档中文信息:

import os
f=open('test1.txt','a+',encoding="utf-8") #test1是已经存在于当前目录下的文档
print(f.read())
f.close

记得一定要 import os 模块,并且在open函数里加入参数encoding=“utf-8”。

要将 CSV 文件转换为 UTF-8 编码格式,并读入 Pandas DataFrame 中,可以按照以下步骤操作: 1. 使用 Pandas 的 `read_csv` 函数读取 CSV 文件。例如: ``` import pandas as pd df = pd.read_csv('file.csv', encoding='原始编码格式') ``` 在这个示例中,我们使用了 Pandas 的 `read_csv` 函数将 CSV 文件读入到一个 Pandas DataFrame 中,并指定了 CSV 文件的原始编码格式。 2. 将读入的数据转换为 UTF-8 编码格式。例如: ``` import pandas as pd df = pd.read_csv('file.csv', encoding='原始编码格式') df = df.applymap(lambda x: x.encode('utf-8').decode('utf-8')) ``` 在这个示例中,我们使用了 Pandas DataFrame 对象的 `applymap` 方法,将 DataFrame 中的每一个元素都转换为 UTF-8 编码格式。 3. 对转换后的数据进行处理或者写入新的 CSV 文件。例如: ``` import pandas as pd df = pd.read_csv('file.csv', encoding='原始编码格式') df = df.applymap(lambda x: x.encode('utf-8').decode('utf-8')) # 对数据进行处理 # ... # 将处理后的数据写入新的 CSV 文件 df.to_csv('new_file.csv', index=False, encoding='utf-8') ``` 在这个示例中,我们对转换后的数据进行了一些处理,然后使用 Pandas DataFrame 对象的 `to_csv` 方法将处理后的数据写入到一个新的 CSV 文件中。需要注意的是,我们在写入文件时指定的编码格式为 UTF-8,并将 `index` 参数设置为 `False`,以避免写入的数据中出现多余的行号。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

irrationality

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值