关于Python3的中文编码问题

最新推荐文章于 2023-02-13 14:58:10 发布

Python忠实粉丝

最新推荐文章于 2023-02-13 14:58:10 发布

阅读量844

点赞数

分类专栏： Python与数据挖掘算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010233524/article/details/80419156

版权

Python与数据挖掘算法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在做切词实验的时候，用jieba模块，相信很多人都已经熟悉。但是中文切词的编码问题的困扰你遇到了吗？

python3中的decode常常报错，Windows操作系统环境下，jieba切词默认时gbk编码。

这里，要注意，在输入和输出文件打开时用codecs去打开，说明是utf-8编码，一切问题就解决了

import codecs

。。。

fin = codecs.open(inputFile, 'r',encoding="utf-8")

fout = codecs.open(outputFile, 'a+','utf-8')

。。。。

Python忠实粉丝

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于Python3的中文编码问题

在做切词实验的时候，用jieba模块，相信很多人都已经熟悉。但是中文切词的编码问题的困扰你遇到了吗？python3中的decode常常报错，Windows操作系统环境下，jieba切词默认时gbk编码。这里，要注意，在输入和输出文件打开时用codecs去打开，说明是utf-8编码，一切问题就解决了import codecs。。。fin = codecs.open(inputFile, 'r',en...
复制链接

扫一扫

专栏目录

Python忠实粉丝 CSDN认证博客专家 CSDN认证企业博客

码龄11年

10: 原创

44万+: 周排名

11万+: 总排名

7878: 访问

: 等级

165: 积分

11: 粉丝

12: 获赞

6: 评论

12: 收藏

私信

关注

热门文章

分类专栏

最新评论

安装docker和docker-compose遇到的问题
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
Python 网页截屏
Python忠实粉丝: 图片存放的位置是在代码中定义的，driver.get_screenshot_as_file(r"路径")，你再试试
Python 网页截屏
~飘渺的风儿: 我在Python解释器里直接运行了网页截图程序（用的是谷歌浏览器驱动），控制台返回true，图片放哪找不到，没有定义位置，Python目录里也没有
时间序列与非时间序列的异常检测
图不灵: 然后呢，样本均衡和特征选择的实现细节，可以说说嘛？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。