文件读取时的编码错误问题如何解决

最新推荐文章于 2024-05-21 09:57:02 发布

Time_traveler233

最新推荐文章于 2024-05-21 09:57:02 发布

阅读量1.4k

点赞数 1

文章标签： python json 乱码

本文链接：https://blog.csdn.net/Time_traveler233/article/details/106304357

版权

编码遇到些错误，所以写一下部分解决办法：
①f = codecs.open(’./sentence.txt’,‘r’,‘utf-8’)
RuntimeError: you must first build vocabulary before training the model

open(file)默认GBK，所以要注明用UTF-8来读文件。中文词先建立词库。

②s1=ss.split(" ".encode(encoding=‘utf-8’))

TypeError: must be str or None, not bytes

split需要str格式读取
③g=open(‘D:\Download\code\w2v\sentence.txt’, ‘rb’,'utf-8)
TypeError:an integer is required (got type str)
二进制读取不能用utf-8转换
改为：

with codecs.open('./sentence.txt','r','utf-8') as f:
    sss=[]
    while True:
        ss=f.readline().replace('\n','').rstrip()#对str才能操作
        if ss==''

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Time_traveler233

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文件读取时的编码错误问题如何解决

编码遇到些错误，所以写一下部分解决办法：①f = codecs.open(’./sentence.txt’,‘r’,‘utf-8’)RuntimeError: you must first build vocabulary before training the modelopen(file)默认GBK，所以要注明用UTF-8来读文件。中文词先建立词库。②s1=ss.split(" ".encode(encoding=‘utf-8’))TypeError: must be str or None,
复制链接

扫一扫