pandas基本切片用法及具体实例(超级实用且有注释,老年人看了都能敲代码)

1.设置一个array,并输出

import numpy as np 
import pandas as pd
data = np.array([0, 7, 3, 6, 2, 8, 5, 9, 4]).reshape(3, -1)#以三行为基础重排,若-1放在reshape的第一个参数,则是列数规定,行数不限
df = pd.DataFrame(data, index=['One', 'Two', 'Three'], columns=['a', 'b', 'c'])#index设置行名,columns设置列名
df

在这里插入图片描述

df['a']#取出列名为a的一列

在这里插入图片描述

df.loc['One']#取出行名为one的一行

在这里插入图片描述
4.

df.loc['Two']#取出行名为'Two'的一行

在这里插入图片描述

df[:2]#取出前两行

在这里插入图片描述
6.

df.iloc[:,:2]#取出全部行和前两列

在这里插入图片描述
7.

list(df.columns)#取列名

在这里插入图片描述
8.

list(df.index)#取出行名

在这里插入图片描述
9.

df['b']['Two']#取出行号为b且列号为two的元素

在这里插入图片描述
10.

list(df.iloc[:,2])#取出索引为2的列元素并以List形式输出

在这里插入图片描述
11.

df.drop('a',axis=1)#drop以a为列名的那一列

在这里插入图片描述
12.

list(df.sum(axis=0))#输出每一列的相加之和

在这里插入图片描述
13.

df.iloc[:,list(df.sum(axis=0)<17)]#输出每一列相加后之和<17的列

在这里插入图片描述
14.

df.sort_values(by='Two',axis=1)#将行名为two的那一行从小排到大,按列排就是不能改变每一列的元素只改变顺序

在这里插入图片描述
15.

df.T#输出转置矩阵,就是矩阵的逆

在这里插入图片描述
16.

(df<=2).any(axis=0)#输出只要含有小于或等于2元素的行名

在这里插入图片描述
17.

df.applymap(lambda x:x*2-1)#将所有元素*2-1

在这里插入图片描述
18.

df.apply(lambda x:max(x),axis=1)#找出每行最大的元素并输出

在这里插入图片描述
小结:loc与iloc的区别:
loc按名字寻找元素,iloc按索引寻找元素

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas 是一个强大的数据分析工具,常用于数据清洗、数据处理、数据分析和数据可视化。下面是使用 Pandas 处理数据的基本步骤和代码示例: 1. 导入 Pandas 库和数据集 ```python import pandas as pd # 读取数据集 df = pd.read_csv('data.csv') ``` 2. 查看数据集 ```python # 查看前几行数据 df.head() # 查看后几行数据 df.tail() # 查看数据集的基本信息 df.info() # 查看数据集的描述统计信息 df.describe() ``` 3. 数据清洗 ```python # 删除含有缺失值的行 df.dropna(inplace=True) # 删除重复的行 df.drop_duplicates(inplace=True) # 重命名列名 df.rename(columns={'old_name': 'new_name'}, inplace=True) # 修改某列数据类型 df['column_name'] = df['column_name'].astype('int') # 替换某个值 df['column_name'].replace('old_value', 'new_value', inplace=True) # 去除某列左右两边的空格 df['column_name'] = df['column_name'].str.strip() ``` 4. 数据处理 ```python # 筛选某些列 df_new = df[['column1', 'column2']] # 筛选满足条件的行 df_new = df[df['column1'] > 10] # 对某列进行排序 df.sort_values('column_name', ascending=False, inplace=True) # 按某列进行分组 grouped = df.groupby('column_name') # 对分组后的数据进行聚合操作 result = grouped.agg({'column1': 'sum', 'column2': 'mean'}) ``` 5. 数据可视化 ```python import matplotlib.pyplot as plt # 绘制柱状图 df.plot.bar(x='column1', y='column2') # 绘制折线图 df.plot.line(x='column1', y='column2') # 绘制散点图 df.plot.scatter(x='column1', y='column2') # 绘制饼图 df.plot.pie(y='column1') ``` 以上是 Pandas 处理数据的基本步骤和代码示例,可以根据具体的需求进行相应的修改和拓展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值