【Python】改BUG之旅

最新推荐文章于 2023-03-25 11:32:34 发布

YWP_2016

最新推荐文章于 2023-03-25 11:32:34 发布

阅读量395

点赞数 2

分类专栏： Python

本文链接：https://blog.csdn.net/YWP_2016/article/details/102657199

版权

Python 专栏收录该内容

47 篇文章 8 订阅

订阅专栏

近日重装了系统，虽说大多文件得以幸存，但arcGIS、PyCharm等常用软件以及各种环境变量，仍需重新配置。

昨晚，决定以牺牲少许准确率为代价，换取实验速度的显著提升（省事儿）。于是，开始了一通胡乱操作：

①怀着轻松的心情打开PyCharm，试图不加任何修改直接运行原程序。当然，以bug（环境变量问题）告终。②经过配Anaconda环境变量、设置编译器等规范操作，怀着期待的心情，再次运行。不料，再次以bug（zipfile.BadZipFile: File is not a zip file）告终。③此时的文凭已有些许焦躁，耐心渐被数行红字磨光。继续保持优雅姿态改bug：打开浏览器—粘贴报错原因—搜索。没想到，农逢对手，这个错误是如此的奇葩，引无数码农竞挠头（几乎搜不到解决方案）。④21:00 无奈的文凭决定关闭电脑，打开“野狼disco”，忘记烦恼。⑤时间到了第二天——文凭的今日计划是：（尽量）改一个bug。卸载、重装所用包，检查各包版本，尝试多种安包方式，均无效。最后，决定瞎改。将报错处gensin\__init__.py的“from gensim import parsing, corpora, matutils, interfaces, models, similarities, summarization, utils”直接注释掉，另有corpora\__init__.py的“#from .wikicorpus import WikiCorpus”也直接注释掉。竟然，神奇地好了。

果然，改bug的最高原则是——瞎改。

安装包错误：Python无法安装pyxdameraulevenshtein

conda安装：https://anaconda.org/conda-forge/pyxdameraulevenshtein

pandas读取.csv文件错误：pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4

参考：我产生错误的原因是偷懒直接修改的后缀名，正确做法是将文件打开另存在数据集要求的格式。例如我需要csv文件，现有是xlsx文件，需要打开另存在csv文件，不能直接修改后缀名。

读取.csv文件遇编码问题：'utf-8' codec can't decode byte 0xa1 in position 1934: invalid start byte

参考：产生错误的原因是‘utf-8’不能解码位置1934的那个字节（0xa1），也就是这个字节超出了utf-8的表示范围了。解决：在读取数据的时候，显式添加编码方式encoding='gb18030'，别的编码也可以试试哟。

因Python版本不同导致的错误

涉及zip()，处理numpy数组报错：AxisError: axis 0 is out of bounds for array of dimension 0

参考：在 Python 3.x 中为了减少内存，zip() 返回对象而非列表。如需展示列表，需手动 list() 转换。

附：numpy模块之axis 对于矩阵操作中axis的理解，以及axis=-1的解释

axis常在numpy和tensorflow中用到，作为对矩阵（张量）进行操作时需要指定的重要参数之一。设定axis=-1,0,1...，用来指定执行操作的数据如何划分。设axis=i，则沿着第i个下标变化的方向进行操作。axis是将矩阵进行分组，然后再操作。而分组则意味着会降维。