转码问题
看!是二哈
这个作者很懒,什么都没留下…
展开
-
2021-03-11
批量将.txt编码格式转化为utf8 转载 https://www.cnblogs.com/xy-ouyang/p/13182719.html import os import codecs import chardet def list_folders_files(path): """ 返回 "文件夹" 和 "文件" 名字 :param path: "文件夹"和"文件"所在的路径 :return: (list_folders, list_files)转载 2021-03-11 14:20:58 · 100 阅读 · 0 评论 -
tidytextpy中的 ‘gbk‘ codec can‘t decode byte 0x94 in position 94: illegal multibyte sequence 报错
最近,本小白在学习文本分析中遇到了一个好用的库tidytextpy, github地址:https://github.com/thunderhit/tidytextpy 是本论坛“邓旭东HIT”进行修改的,非常感谢添加这个有用的功能。 在运行示范代码后有报错: from tidytextpy import get_stopwords cn_stps = get_stopwords('chinese') print(cn_stps[:20]) UnicodeDecodeError: 'gbk' codec原创 2020-10-23 19:41:37 · 999 阅读 · 0 评论