今天在使用pandas的时候出现了这个问题
C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops.py:1167: FutureWarning: elementwise comparison failed; returning scalar instead, but in the future will perform elementwise comparison
result = method(y)
Traceback (most recent call last):
File "e:/新冠肺炎/gitHub爬虫/delete404.py", line 50, in <module>
main()
File "e:/新冠肺炎/gitHub爬虫/delete404.py", line 39, in main
df = df[df.loc[:,'location']!='404']
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops.py", line 1283, in wrapper
res = na_op(values, other)
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops.py", line 1169, in na_op
raise TypeError("invalid type comparison")
TypeError: invalid type comparison
然后我是用两行代码使用了筛选
df = df[df.loc[:,'location']!='404']
df = df[df.loc[:,'language']!='404']
但是下面那句话是不报错的 上面这句话是报错的
而且与顺序无关 ,交换了顺序之后 依然是只有df = df[df.loc[:,'location']!='404']
这行代码报错
然后网上的搜索了解到了是类型比较错误的导致的
可以具体参考下这个连接https://stackoverflow.com/questions/40659212/futurewarning-elementwise-comparison-failed-returning-scalar-but-in-the-futur
而我这里的问题是在于数据中存在Nan,然后导致不可以比较 所以网上的抑制警告的办法
对我来说没有什么用 这个办法可以参考这个文章http://www.voidcn.com/article/p-nnstzdkf-btn.html
因为他们的原因是numpy,python自带类型,pandas的类型之间不兼容导致的,他这里的办法是这样的
全局禁止警告:
import warnings import numpy as np warnings.simplefilter(action='ignore', category=FutureWarning) print('x' in np.arange(5)) #returns False, without Warning
逐行抑制警告.
import warnings import numpy as np with warnings.catch_warnings(): warnings.simplefilter(action='ignore', category=FutureWarning) print('x' in np.arange(2)) #returns False, warning is suppressed print('x' in np.arange(10)) #returns False, Throws FutureWarning
而我只能有两个解决办法 第一个办法就是读取的时候,把csv文件里的Nan,改成字符串
或者直接使用df = df.fillna(' ')
给他填充一个数据 ,因为我这里是字符串比较,所以我也填充一个可以比较的类型(字符串),然后就可以正常的执行了