解决txt记事本乱码问题

前言:如果在文件没有损坏的情况下,大概率时编码格式的问题。

问题:左侧为文本乱码,右侧为实际内容

一.解决方案

1.直接将文本另保存,换其他格式。然后打开试试看:

2.在本文内转换格式

3.另保存中的格式不够多。可能没有其合适的编码。可以使用代码程序来进行另保存

以下时python代码:这是使用了gbk编码格式打开文件

txet = []
with open('./story.txt', 'r', encoding='gbk') as f:
    text = f.readlines()
    print(text)

可以尝试比较常见的编码:

  1. ASCII(American Standard Code for Information Interchange):最早的字符编码标准,用于表示英文字母、数字和一些特殊字符,采用7位二进制数表示一个字符。

  2. UTF-8(Unicode Transformation Format-8):一种可变长度字符编码,用于Unicode字符集,能表示世界上大部分国家的文字,采用1至4个字节表示一个字符。

  3. UTF-16(Unicode Transformation Format-16):一种固定长度字符编码,同样用于Unicode字符集,采用2或4个字节表示一个字符。

  4. UTF-32(Unicode Transformation Format-32):一种固定长度字符编码,同样用于Unicode字符集,每个字符固定占用4个字节。

  5. ISO-8859-1(Latin-1):一种单字节编码,用于表示西欧语言中的字符。

  6. GBK(Guo Biao Kang Xi):用于简体中文的字符集编码,包含了中文、英文和一些符号。

  7. Big5:用于繁体中文的字符集编码。

  8. Shift-JIS:一种用于日文的字符编码。

发现文本可以正常看见:

但是每句话前面有转义字符,可以通过下面代码处理即可:

txet = []
with open('./story.txt', 'r', encoding='gbk') as f:
    text = [i.replace('\u3000\u3000', '') for i in f.readlines()]
    print(text)

看看效果:(没有转义字符了)

 最后保存成你想要的格式即可(一般是utf-8),按照以下代码:

with open('./story1.txt', 'w', encoding='utf-8') as fp:
     for i in text:
         fp.write(i)

我们看看目录中保存文件的效果:

当然你也可以使用编程语言,不局限于python!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值