数据分析必备：一步步教你如何用Pandas做数据分析（6）

最新推荐文章于 2024-09-20 00:09:16 发布

知识分享小能手

最新推荐文章于 2024-09-20 00:09:16 发布

阅读量336

点赞数 1

分类专栏：数据分析学习心得体会 numpy 文章标签：数据分析 pandas 数据挖掘 linux 大数据 python3.11 数据仓库

本文链接：https://blog.csdn.net/qq_45746668/article/details/139158929

版权

学习心得体会同时被 3 个专栏收录

236 篇文章 0 订阅

订阅专栏

数据分析

156 篇文章 1 订阅

订阅专栏

numpy

18 篇文章 0 订阅

订阅专栏

1、Pandas 函数应用

Pandas 重建索引操作实例
要将您自己或其他库的函数应用于Pandas对象，您应该了解三个重要的方法。方法如下所述。要使用的适当方法取决于您的函数是希望对整个数据帧进行操作，还是行操作还是按列操作，还是按元素操作。
表函数应用程序：pipe()
行或列函数应用程序：apply()
元素级函数应用程序：applymap()

1.1、表函数应用程序

可以通过传递函数和适当数量的参数作为管道参数来执行对DataFrame自定义操作

加法器函数
例如，将2个值添加到DataFrame中。加法器功能将两个数字值相加并返回总和。

  def adder(ele1,ele2):
    return ele1+ele2

我们使用自定义函数对DataFrame进行操作.

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
 df.pipe(adder,2)

我们看下完整的程序：

import pandas as pd
import numpy as np
def adder(ele1, ele2):
    return ele1 + ele2
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.pipe(adder, 2)
print(df.apply(np.mean))

运行结果

       col1 col2 col3
 0 2.176704 2.219691 1.509360
 1 2.222378 2.422167 3.953921
 2 2.241096 1.135424 2.696432
 3 2.355763 0.376672 1.182570
 4 2.308743 2.714767 2.130288

1.2、行或列函数应用程序

可以使用apply()方法沿DataFrame或Panel的轴应用任意函数，该方法与描述性统计方法一样，采用可选的axis参数。默认情况下，该操作按列执行，将每一列视为类似数组的形式。

实例 1

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.apply(np.mean)
print(df.apply(np.mean))

运行结果：

col1   -0.241399
col2    0.141497
col3   -0.102721
dtype: float64

通过传递 axis 参数，可以逐行执行操作。

实例 2

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.apply(np.mean, axis=1)
print(df.apply(np.mean))

运行结果：

col1   -0.361706
col2    0.034588
col3    0.337259
dtype: float64

实例 3

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.apply(lambda x: x.max() - x.min())
print(df.apply(np.mean))

运行结果

col1    0.081140
col2    0.772552
col3    0.749451
dtype: float64

1.3、元素级函数应用程序

并非所有函数都可以向量化（NumPy数组既不返回另一个数组，也不返回任何值），DataFrame上的applymap() 方法和Series上的map() 类似地接受任何采用单个值并返回单个值的Python函数。
实例 1

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
# 自定义函数
df['col1'].map(lambda x: x * 100)
print(df.apply(np.mean))

运行结果：

col1   -0.062886
col2    0.404082
col3    0.026754
dtype: float64

实例 2

import pandas as pd
import numpy as np
# 自定义函数
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.applymap(lambda x: x * 100)
print(df.apply(np.mean))

运行结果：

col1    0.022429
col2    0.764061
col3    0.036986
dtype: float64

知识分享小能手

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录