pandas中DataFrame和get_dummies函数

1.pandas.DataFrame.apply

DataFrame.apply(self, func, axis=0, raw=False, result_type=None, args=(), **kwds)

作用是对Dataframe的某个轴应用某个函数。
传入到函数的是一个Series对象,其索引是DataFrame的索引(axis=0)或DataFrame的列(axis=1)。默认情况下(result_type=None),根据应用函数的返回类型推断最终的返回类型。否则,它取决于result_type参数。
参数:

  1. 函数: 应用于每个列或行的函数功能。

  2. axis:{0或’index’,1或’columns’},默认为0

    • 0或’index’:将函数应用于每一列。
    • 1或“列”:将功能应用于每一行。
  3. 原始:布尔值,默认为False 决定是否将行或列作为Series或ndarray对象传递:

    • False :将每个行或列作为Series传递给函数。
    • True:传递的函数将改为接收ndarray对象。
  4. result_type :{‘expand’,‘reduce’,‘broadcast’,None},默认为None
    这些仅在以下情况下起作用axis=1:

    • ‘expand’:类似列表的结果将变成列。
    • ‘reduce’:如果可能,返回一个Series,而不是扩展类似列表的结果。这与“扩展”相反。
    • ‘broadcast’:结果将以DataFrame的原始形状进行广播,原始索引和列将保留。 默认行为(无)取决于所应用函数的返回值:类似于列表的结果将作为一系列结果返回。但是,如果apply函数返回Series,则这些列将扩展为列。
  5. args: 元组 除array/series外,还传递给func的位置参数。

  6. ** kwds 作为关键字参数传递给func的其他关键字参数 。

2.pandas.get_dummies

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)

官方文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html#pandas.get_dummies
哑变量处理,又叫虚拟变量,可以实现离散型数据进行one-hot编码处理。
data:
示例如下:

s = pd.Series(list('abc'))
pd.get_dummies(s)

得出结果如下
在这里插入图片描述

df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
  ...:                    'C': [1, 2, 3]})

在这里插入图片描述

pd.get_dummies(df)

在这里插入图片描述

pd.get_dummies(df, prefix=['col1', 'col2'])

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值