pandas 索引总结(task2)

索引

一、单级索引

loc方法、iloc方法、[]操作符

1.loc
本质上说,loc中能传入的只有布尔列表索引子集构成的列表
用法:
(1)单行、多行索引
(2)单列、多列索引
(3)联合索引
(4)函数索引
(5)布尔索引
2.iloc(与loc不同,切片右端点不包含)
iloc中接收的参数只能为整数或整数列表,不能使用布尔索引
用法:
(1)单行、多行索引
(2)单列、多列索引
(3)混合索引
(4)函数索引
3.[]操作符
用法:
(1)单元素索引
(2)多行索引
(3)函数索引
(4)布尔索引
对于DataFrame
(5)单列、多列索引

布尔索引

1.布尔符号:’&’,’|’,’~’:分别代表和and,或or,取反not
2. isin方法

快速标量索引

只需要取一个元素,at和iat方法

区间索引

1.interval_range方法
2.利用cut将数值列转为区间为元素的分类变量

二、多级索引

创建多级索引

1.通过from_tuple或from_arrays
2.通过Array创建
3.指定df中的列创建(set_index方法

索引层的交换

1.swaplevel方法(两层交换)
2.reorder_levels方法(多层交换)

三、索引设定

index_col参数

index_col是read_csv中的一个参数

reindex和reindex_like

reindex是指重新索引,它的重要特性在于索引对齐,很多时候用于重新排序
reindex_like的作用为生成一个横纵索引完全与参数列表一致的DataFrame,数据使用被调用的表

set_index和reset_index¶

set_index将某些列作为索引
reset_index主要功能是将索引重置

rename_axis和rename

rename_axis是针对多级索引的方法,作用是修改某一层的索引名,而不是索引标签
rename方法用于修改列或者行索引标签,而不是索引名

四、常用索引型函数

where函数
mask函数
query函数

五、重复元素处理

duplicated方法

该方法返回了是否重复的布尔列表

drop_duplicates方法

剔除重复项

六、抽样函数:sample函数

参数:
(1):n为样本量
(2):frac为抽样比
(3):replace为是否放回
(4):axis为抽样维度,默认为0,即抽行
(5):weights为样本权重,自动归一化

要将从1开始的索引列添加到Pandas数据框中,可以使用Pandas中的reset_index()方法。首先,创建一个示例数据框并打印出原始数据框。然后,使用reset_index()方法添加从1开始的索引列,并重新命名索引列的名称。最后,输出新的数据框。 以下是一个具体的示例代码: ``` import pandas as pd # 创建一个示例数据框 data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) # 输出原始数据框 print(df) # 使用reset_index()方法添加从1开始的索引列 df.reset_index(drop=False, inplace=True) df['index'] = df['index'] + 1 # 重新命名索引列的名称 df = df.rename(columns={'index': 'new_index'}) # 输出新数据框 print(df) ``` 请注意,reset_index()方法需要在索引列之前添加一个新的整数列,以便在保留原始索引的情况下添加一个新的索引列。如果drop=True,则原始索引列将被删除。在本例中,我们选择保留原始索引列并添加一个新的索引列。使用inplace=True可以直接在原数据框上操作,使代码更简洁。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [pandas添加索引列,从一开始](https://blog.csdn.net/weixin_62650212/article/details/130383050)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Python数据分析实践:pandas索引处理new.pdf](https://download.csdn.net/download/u011062044/85634854)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值