pandas的groupby\query\str\pivot_table\apply

最新推荐文章于 2024-03-21 07:30:00 发布

奔跑的蚂蚁121

最新推荐文章于 2024-03-21 07:30:00 发布

阅读量206

点赞数

分类专栏： pandas

pandas 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

转载：原文地址

import seaborn as sns
import numpy as np

df = sns.load_dataset(name="titanic")

#对列的字符进行替换
#我们看到船票比如A/5 21171 有两部分组成，一部分是英文字符，一部分是纯数字，如果我们只想保留数字部分，我们直接用str字符串进行处理
#df["fare"] = df["fare"].str.replace(r"[^d+]',")

#数据集的过滤
df_temp_1 = df[(df["sex"]=="male")&(df["age"]<=38)]

#query函数,重点函数
df_temp_2 = df.query("age in [22,38]")

#数据的分类

#where函数
df["adult"] = np.where(df["age"]>=18,"adult","childen")

#apply函数
def convert_age(age):
    if age>0 and age<=10:
        return "child"
    elif age<18:
        return "youth"
    else:
        return "adult"

df["age category"] = df["age"].apply(convert_age)

#数据的切片和透视表
df.groupby("sex")["survived"].agg(["count"])

#对数据进行轴切片分析
df.groupby(["survived","pclass"])["age"].agg(["size","max","min","mean"])

#数据透视表
df.pivot_table(columns=["sex"],index=["survived","pclass"],values="age",aggfunc={'age':[np.mean,min,max]})

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

奔跑的蚂蚁121

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas的groupby\query\str\pivot_table\apply

转载：原文地址import seaborn as snsimport numpy as npdf = sns.load_dataset(name=&quot;titanic&quot;)#对列的字符进行替换#我们看到船票比如A/5 21171 有两部分组成，一部分是英文字符，一部分是纯数字，如果我们只想保留数字部分，我们直接用str字符串进行处理#df[&quot;fare&quot;] = df[&quot;fare&quot
复制链接

扫一扫