Python-科学计算-pandas-19-df分组上中下旬

系统:Windows 10
语言版本:conda 4.4.10
编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64
pandas:0.22.0

  • 这个系列讲讲Python的科学计算及可视化
  • 今天讲讲pandas模块
  • 按照时间列,得出每行属于上中下旬,进而对df进行分组

Part 1:场景描述

  1. 已知df,包括3列,["time", "pos", "value1"]
  2. 根据time列的结果对df进行分组,分为上旬、中旬、下旬三组
  3. 分组规则,设置如下(这里只是假设一种分法,官方分法请查阅相关资料):
    • 每月10号之前(包括10号)为上旬,对应数学表达式为:x ≤10
    • 每月10-20号为中旬,对应数学表达式为:10<x ≤20
    • 每月20号之后为下旬,不包括20号,对应数学表达式为:x >20

df
在这里插入图片描述

Part 2:代码逻辑

  1. 新生成time1列,该列是time列对应的日期格式数据
  2. 生成一个新列flag,为time1列对应的具体几号(取值范围1-31)
  3. flag进行判断,将结果写入xun
  4. 根据xun列进行过滤,获取对应数据

Part 3:代码

import pandas as pd
import numpy as np

# 显示所有列
pd.set_option('display.max_columns', None)
# 显示所有行
pd.set_option('display.max_rows', None)
# 设置显示长度为100
pd.set_option('max_colwidth', 100)
# 设置对齐
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
# 设置打印宽度
pd.set_option('display.width', 180)

dict_1 = {"time": ["2019-11-02", "2019-11-15", "2019-11-25", "2019-11-05",
                   "2019-12-13", "2019-12-03", "2019-12-16", "2019-12-29"],
          "pos": ["A", "A", "B", "B", "C", "C", "C", "D"],
          "value1": [10, 20, 30, 40, 50, 60, 70, 80]}

df = pd.DataFrame(dict_1, columns=["time", "pos", "value1"])
print("\n", "df", "\n", df, "\n", df.dtypes)

df["time1"] = pd.to_datetime(df['time'])
print("\n", "df", "\n", df, "\n", df.dtypes)

# 获取年月日信息
df["年"] = df["time1"].dt.year
df["月"] = df["time1"].dt.month
df["日"] = df["time1"].dt.day
df["时"] = df["time1"].dt.hour
df["分"] = df["time1"].dt.minute
df["秒"] = df["time1"].dt.second

df["flag"] = df["日"]

df["xun"] = np.where((df["flag"] > 10) & (df["flag"] <= 20), "中旬", np.where(df["flag"] <= 10, "上旬", "下旬"))
print("\n")
print(df)

df_1 = df[df["xun"] == "上旬"]
print("\n")
print(df_1)

df_1 = df[df["xun"] == "中旬"]
print("\n")
print(df_1)

df_1 = df[df["xun"] == "下旬"]
print("\n")
print(df_1)


代码截图

在这里插入图片描述

在这里插入图片描述

Part 4:部分代码解读

  1. df["time1"] = pd.to_datetime(df['time'])时间格式转换,新生成的数据类型为datetime64

时间格式转换
在这里插入图片描述
2. df["日"] = df["time1"].dt.day获取日期对应的具体几号
3.df["xun"] = np.where((df["flag"] > 10) & (df["flag"] <= 20), "中旬", np.where(df["flag"] <= 10, "上旬", "下旬")),两重判断
- np.where(条件,满足条件结果,不满足条件结果)
- 支持嵌套,有点VBA公式的感觉
- 对flag列的每个元素进行计算,结果为xun

在这里插入图片描述
4. df_1 = df[df["xun"] == "上旬"]获取上旬数据

在这里插入图片描述

本文为原创作品,欢迎分享朋友圈

长按图片识别二维码,关注本公众号
Python 优雅 帅气
12x0.8.jpg

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值