第三章索引

最新推荐文章于 2023-05-19 18:47:22 发布

VIP文章布丁咩咩

最新推荐文章于 2023-05-19 18:47:22 发布

阅读量1.5k

点赞数

分类专栏： pandas数据分析

本文链接：https://blog.csdn.net/zcy0108/article/details/111564918

版权

一、索引器

1. 表的列索引

1）从DataFrame中取出相应的列，返回值为Series
① df[‘column_name’]
$\Downarrow \quad \Uparrow$

② df.column_name
列名中不包含空格
2）取出多个列，返回值为一个DataFrame
df[[‘column1’,‘column2’]]

2. 序列的行索引

1）以字符串为索引的Series
① 取出单个索引的字母，返回一个Series
s[‘index’]
② 取出多个索引的对应元素
s[[‘index1’,‘index2’,……]]
③ 取出某两个索引之间的元素
s[‘start_index’,‘end_index’,‘步长’]
start_index与end_index再整个索引中唯一出现；出来的结果包含两个端点
如果前后端点的值不唯一，那么需要经过排序才能使用切片
s.sort_index()[‘start_index’,‘end_index’]
2）以整数为索引的Series
① 同字符串的① ② 用法可取出相应索引元素的值
② s[起点位置：终点位置：步长]
不包含右端点哦~~
如果不想陷入麻烦，那么请不要把纯浮点以及任何混合类型（字符串、整数、浮点类型等的混合）作为索引，否则可能会在具体的操作时报错或者返回非预期的结果，并且在实际的数据分析中也不存在这样做的动机。

3.loc索引器

1）基于元素的 loc 索引
loc[*,#]
*为 ① 单个元素
如果该元素在索引中重复则结果为DataFrame，否则为Series
例：df_demo.loc[‘Qiang Sun’]
② 元素列表
取出列表中所有元素值对应的行或列
例：df_demo.loc[[‘Qiang Sun’,‘Quan Zhao’], [‘School’,‘Gender’]]
③ 切片
如果是唯一值的起点和终点字符，那么就可以使用切片，并且包含两个端点，如果不唯一则报错
使用整数切片的时候和上面字符串索引的要求一致
④ 布尔列表
列表为 True 的位置所对应的行会被选中， False 则会被剔除。
例：df_demo.loc[df_demo.Weight>70].head()
df_demo.loc[df_demo.Grade.isin([‘Freshman’, ‘Senior’])].head()
对于复合条件而言，可以用 |（或）, &（且）, ~（取反）的组合来实现

练一练：
select_dtypes 是一个实用函数，它能够从表中选出相应类型的列，若要选出所有数值型的列，只需使用 .select_dtypes(‘number’) ，请利用布尔列表选择的方法结合 DataFrame 的 dtypes 属性在 learn_pandas 数据集上实现这个功能。

# 是数值的是True，不是的是False
bool=[str(df_demo[v].dtype) in {
   'float64','int64'} for v in df_demo

最低0.47元/天解锁文章

布丁咩咩

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第三章索引

一、索引器1. 表的列索引1）从DataFrame中取出相应的列，返回值为Series① df[‘column_name’]⇓⇑\Downarrow \quad \Uparrow⇓⇑② df.column_name列名中不包含空格2）取出多个列，返回值为一个DataFramedf[[‘column1’,‘column2’]]2. 序列的行索引1）以字符串为索引的Series① 取出单个索引的字母，返回一个Seriess[‘index’]② 取出多个索引的对应元素s[[‘index
复制链接

扫一扫