👦👦一个帅气的boy,你可以叫我Love And Program
🖱 ⌨个人主页:Love And Program的个人主页
💖💖如果对你有帮助的话希望三连💨💨支持一下博主
python是目前非常火爆的语言,其在人工智能、数据分析领域都占有一席之地,无论是学习还是工作,都会给你带来相当大的帮助。我在这给大家 推荐一个快速提升自己的网站👉👉 牛客网,他们现在的IT题库内容很丰富,属于国内做的很好的了,可以在下图中看见里面试题应有尽有,最最最重要的里面的资源全部免费!!!(亲测全免费,写题解还可以得小礼物)欢迎大家订阅本专栏🥰🥰
系列专栏链接:
🚬🚬前言
前面我们学习了基本的**查看数据**部分,即`pandas`中基本的`head,iloc,loc,shape`函数,接下来我们学习**数据索引**部分。
✍✍什么是数据索引?
数据索引,可以看作为数据切片和切块,是使用不同的列或索引切分数据,实现从数据中获取特定子集的方式,在数据分析的日常工作中不能说是几乎会用到,应该说是‘必须’会用到!无论是查找补充缺失值,还是搜索特定位置数据,熟练后你都可以玩出花来😎😎
下面进入正题👇👇
👨🏫👨🏫用户没有补全的信息
通过读题我们可以想到如下步骤👏👏:
数据补全 -> 如何判断空值 -> 找出判断空值函数 -> 判断某列是否是空值 -> 输出数据
既然如此,今天我们有学会了一个新的函数:isnull()
函数,他还有个别名isna()
函数,通过打印方法可以看出两者异同。
再回归题目
import numpy as np
import pandas as pd
data= pd.DataFrame({
"Nowcoder_ID":[1111,2222,44444],
"Level":[1,2,3],
"Language":['Python','CPP',np.nan],
"Achievement_value":[8711,13,999999],
"Num_of_exercise":[500,2,32],
"Graduate_year":[50,np.nan ,5]
})
输出为
我们用isnull()
函数看看会出现什么👇👇
缺失位置判断为True
,说明确实存在缺失值!但是题目最终要的结果是如下形式:
显然这是让我们判断一列是否存在缺失值,这时又是两个新函数:all()
和any()
函数
pd.DataFrame.all() | pd.DataFrame.any() |
---|---|
作用:返回是否所有元素都为真(可能在轴上) | 作用:返回是否至少一个元素为真 |
上代码轻松理解,以上代码直接用all()
这里你可能不能一下理解,因此我们给他一个小小的改变,将"Graduate_year"
这一列全改为nan
,如下图所示:
这时再用all()函数便有了很大的变化:正如表格中所写->轴上返回所有元素都为真(可自定义轴,默认为列)
any()函数更好理解->至少一个元素为真
上述两种情况全换成any()
为:
未更改前:
"Graduate_year"
更改nan后:
由此可以清楚区分两者区别,最终代码整理如下:
DA5 牛客网用户没有补全的信息
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.isna().any())
# print(Nowcoder.isnull().any())
# 原题中只存在一行数据,故用all()也可以
# print(Nowcoder.isnull().all())
欢迎大家订阅此专栏,我将带领大家快速熟悉python数据分析领域知识。