python读取txt文件的错误 gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”的解决办法

最新推荐文章于 2023-04-10 21:54:59 发布

luxxxxxxx_

最新推荐文章于 2023-04-10 21:54:59 发布

阅读量1.7k

点赞数

分类专栏：数据挖掘文章标签： python

本文链接：https://blog.csdn.net/weixin_39645344/article/details/82949260

版权

数据挖掘专栏收录该内容

2 篇文章 0 订阅

订阅专栏

众所周知，python对文件读写不友好

在我导入一个新建utf-8 txt文件依然报错之后

最终

data11=open("D:/Downloads/盗墓笔记全集.txt").read().encoding='gbk')
file = open("D:/Downloads/盗墓笔记全集.txt", encoding='gbk')
data=file.read()

可以成功写进data

最后分析数据频率

import jieba.analyse
tag=jieba.analyse.extract_tags(data,15)
print(tag)

最终consel出现

Building prefix dict from the default dictionary ...
Dumping model to file cache C:\Users\Administrator\AppData\Local\Temp\jieba.cache
Loading model cost 2.041 seconds.
Prefix dict has been built succesfully.
['涓涓', '病鏈', '磋交', '涓嶇', '擄細', '娴峰', '嶄細', '轰簡', '绉嶇', '簡寰', '勾杞', '娴锋', '氣滄', '戒汉', '达細']

luxxxxxxx_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python读取txt文件的错误 gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”的解决办法

众所周知，python对文件读写不友好在我导入一个新建utf-8 txt文件依然报错之后最终data11=open("D:/Downloads/盗墓笔记全集.txt").read().encoding='gbk')file = open("D:/Downloads/盗墓笔记全集.txt", encoding='gbk')data=file.read()可以成功写进data...
复制链接

扫一扫

专栏目录