【Python】改BUG之旅

近日重装了系统,虽说大多文件得以幸存,但arcGIS、PyCharm等常用软件以及各种环境变量,仍需重新配置。

昨晚,决定以牺牲少许准确率为代价,换取实验速度的显著提升(省事儿)。于是,开始了一通胡乱操作:

①怀着轻松的心情打开PyCharm,试图不加任何修改直接运行原程序。当然,以bug(环境变量问题)告终。②经过配Anaconda环境变量、设置编译器等规范操作,怀着期待的心情,再次运行。不料,再次以bug(zipfile.BadZipFile: File is not a zip file)告终。③此时的文凭已有些许焦躁,耐心渐被数行红字磨光。继续保持优雅姿态改bug:打开浏览器—粘贴报错原因—搜索。没想到,农逢对手,这个错误是如此的奇葩,引无数码农竞挠头(几乎搜不到解决方案)。④21:00 无奈的文凭决定关闭电脑,打开“野狼disco”,忘记烦恼。⑤时间到了第二天——文凭的今日计划是:(尽量)改一个bug。卸载、重装所用包,检查各包版本,尝试多种安包方式,均无效。最后,决定瞎改。将报错处gensin\__init__.py的“from gensim import parsing, corpora, matutils, interfaces, models, similarities, summarization, utils”直接注释掉,另有corpora\__init__.py的“#from .wikicorpus import WikiCorpus”也直接注释掉。竟然,神奇地好了。

果然,改bug的最高原则是——瞎改。


  • 安装包错误 :Python无法安装pyxdameraulevenshtein

conda安装:https://anaconda.org/conda-forge/pyxdameraulevenshtein

  • pandas读取.csv文件错误:pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4

参考:我产生错误的原因是偷懒直接修改的后缀名,正确做法是将文件打开另存在数据集要求的格式。例如我需要csv文件,现有是xlsx文件,需要打开另存在csv文件,不能直接修改后缀名。

  • 读取.csv文件遇编码问题:'utf-8' codec can't decode byte 0xa1 in position 1934: invalid start byte

参考:产生错误的原因是‘utf-8’不能解码位置1934的那个字节(0xa1),也就是这个字节超出了utf-8的表示范围了。解决:在读取数据的时候,显式添加编码方式encoding='gb18030',别的编码也可以试试哟。

 

 

 

 

因Python版本不同导致的错误

  • 涉及zip(),处理numpy数组报错:AxisError: axis 0 is out of bounds for array of dimension 0

参考:在 Python 3.x 中为了减少内存,zip() 返回对象而非列表。如需展示列表,需手动 list() 转换。


附:numpy模块 之axis    对于矩阵操作中axis的理解,以及axis=-1的解释

axis常在numpy和tensorflow中用到,作为对矩阵(张量)进行操作时需要指定的重要参数之一。设定axis=-1,0,1...,用来指定执行操作的数据如何划分设axis=i,则沿着第i个下标变化的方向进行操作。axis是将矩阵进行分组,然后再操作。而分组则意味着会降维。

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值