pandas中DataFrame和get_dummies函数

最新推荐文章于 2024-05-27 17:00:50 发布

zhangycode

最新推荐文章于 2024-05-27 17:00:50 发布

阅读量1.3k

点赞数

文章标签： python 接口

本文链接：https://blog.csdn.net/zhangycode/article/details/104458495

版权

1.pandas.DataFrame.apply

DataFrame.apply(self, func, axis=0, raw=False, result_type=None, args=(), **kwds)

作用是对Dataframe的某个轴应用某个函数。
传入到函数的是一个Series对象，其索引是DataFrame的索引（axis=0）或DataFrame的列（axis=1）。默认情况下（result_type=None），根据应用函数的返回类型推断最终的返回类型。否则，它取决于result_type参数。
参数：

函数：应用于每个列或行的函数功能。
axis：{0或’index’，1或’columns’}，默认为0
- 0或’index’：将函数应用于每一列。
- 1或“列”：将功能应用于每一行。
原始：布尔值，默认为False 决定是否将行或列作为Series或ndarray对象传递：
- False ：将每个行或列作为Series传递给函数。
- True：传递的函数将改为接收ndarray对象。
result_type ：{‘expand’，‘reduce’，‘broadcast’，None}，默认为None
这些仅在以下情况下起作用axis=1：
- ‘expand’：类似列表的结果将变成列。
- ‘reduce’：如果可能，返回一个Series，而不是扩展类似列表的结果。这与“扩展”相反。
- ‘broadcast’：结果将以DataFrame的原始形状进行广播，原始索引和列将保留。默认行为（无）取决于所应用函数的返回值：类似于列表的结果将作为一系列结果返回。但是，如果apply函数返回Series，则这些列将扩展为列。
args：元组除array/series外，还传递给func的位置参数。
** kwds 作为关键字参数传递给func的其他关键字参数。

2.pandas.get_dummies

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)

官方文档：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html#pandas.get_dummies
哑变量处理，又叫虚拟变量，可以实现离散型数据进行one-hot编码处理。
data:
示例如下：

s = pd.Series(list('abc'))
pd.get_dummies(s)

得出结果如下
在这里插入图片描述

df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
  ...:                    'C': [1, 2, 3]})

在这里插入图片描述

pd.get_dummies(df)

在这里插入图片描述

pd.get_dummies(df, prefix=['col1', 'col2'])

在这里插入图片描述

zhangycode

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas中DataFrame和get_dummies函数

1.pandas.DataFrame.applyDataFrame.apply(self, func, axis=0, raw=False, result_type=None, args=(), **kwds)作用是对Dataframe的某个轴应用某个函数。传入到函数的是一个Series对象，其索引是DataFrame的索引（axis=0）或DataFrame的列（axis=1）。默认情况...
复制链接

扫一扫