python统计字符个数freq_python – 计算一个值在dataframe列中出现的频率

使用groupby和count:

In [37]:

df = pd.DataFrame({'a':list('abssbab')})

df.groupby('a').count()

Out[37]:

a

a

a 2

b 3

s 2

[3 rows x 1 columns]

还有value_counts()作为@DSM有评论,很多方法皮肤猫在这里

In [38]:

df['a'].value_counts()

Out[38]:

b 3

a 2

s 2

dtype: int64

如果要将频率添加回原始数据帧,请使用transform返回对齐的索引:

In [41]:

df['freq'] = df.groupby('a')['a'].transform('count')

df

Out[41]:

a freq

0 a 2

1 b 3

2 s 2

3 s 2

4 b 3

5 a 2

6 b 3

[7 rows x 2 columns]

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python中,使用pandas库的DataFrame对象可以对时间序列数据进行重新采样。重新采样可以将数据从一个时间频率转换为另一个时间频率,例如从日频率转换为月频率或年频率。 要对DataFrame对象进行重新采样,可以使用`resample()`函数。这个函数可以传入一个字符串参数,表示新的时间频率,例如"D"表示日频率,"M"表示月频率。然后,可以通过调用聚合函数(例如mean、sum、count等)对重新采样后的数据进行聚合计算。 以下是一个示例: ```python import pandas as pd # 创建一个示例DataFrame对象 data = {'date': pd.date_range(start='1/1/2022', periods=100, freq='D'), 'value': range(100)} df = pd.DataFrame(data) # 将数据重新采样为月频率,并计算每个月的总和 df_resampled = df.resample('M', on='date').sum() print(df_resampled) ``` 这段代码首先创建了一个示例的DataFrame对象,包含了从2022年1月1日开始的连续100天的日期和对应的数。然后,使用`resample()`函数将数据重新采样为月频率,并通过调用`sum()`函数计算每个月的总和。最后,打印出重新采样后的DataFrame对象。 请注意,`resample()`函数的`on`参数用于指定需要重新采样的时间列,默认情况下会自动推断时间列。在示例中,我们显式地将`on`参数设置为'date',以指定按照'date'列进行重新采样。 希望这个示例对你有帮助!如果你有更多关于重新采样的问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值