每日一题41：按日期分组消费产品

最新推荐文章于 2024-07-22 16:24:23 发布

锂享生活

最新推荐文章于 2024-07-22 16:24:23 发布

阅读量322

点赞数 5

分类专栏：每日一题文章标签：笔记 python

本文链接：https://blog.csdn.net/m0_63227758/article/details/139666310

版权

每日一题专栏收录该内容

44 篇文章 0 订阅

订阅专栏

一、每日一题

表 Activities：

+-------------+---------+
| 列名         | 类型    |
+-------------+---------+
| sell_date   | date    |
| product     | varchar |
+-------------+---------+
该表没有主键(具有唯一值的列)。它可能包含重复项。
此表的每一行都包含产品名称和在市场上销售的日期。

编写解决方案找出每个日期、销售的不同产品的数量及其名称。
每个日期的销售产品名称应按词典序排列。
返回按 sell_date 排序的结果表。
结果表结果格式如下例所示。

示例 1:

输入：
Activities 表：
+------------+-------------+
| sell_date  | product     |
+------------+-------------+
| 2020-05-30 | Headphone   |
| 2020-06-01 | Pencil      |
| 2020-06-02 | Mask        |
| 2020-05-30 | Basketball  |
| 2020-06-01 | Bible       |
| 2020-06-02 | Mask        |
| 2020-05-30 | T-Shirt     |
+------------+-------------+
输出：
+------------+----------+------------------------------+
| sell_date  | num_sold | products                     |
+------------+----------+------------------------------+
| 2020-05-30 | 3        | Basketball,Headphone,T-shirt |
| 2020-06-01 | 2        | Bible,Pencil                 |
| 2020-06-02 | 1        | Mask                         |
+------------+----------+------------------------------+
解释：
对于2020-05-30，出售的物品是 (Headphone, Basketball, T-shirt)，按词典序排列，并用逗号 ',' 分隔。
对于2020-06-01，出售的物品是 (Pencil, Bible)，按词典序排列，并用逗号分隔。
对于2020-06-02，出售的物品是 (Mask)，只需返回该物品名。

解答：

import pandas as pd

# 假设输入数据如下
data = {
    'sell_date': ['2020-05-30', '2020-06-01', '2020-06-02', '2020-05-30', '2020-06-01', '2020-06-02', '2020-05-30'],
    'product': ['Headphone', 'Pencil', 'Mask', 'Basketball', 'Bible', 'Mask', 'T-Shirt']
}

# 创建 DataFrame
df = pd.DataFrame(data)

# 去重
df_unique = df.drop_duplicates()

# 按日期分组，并聚合产品
result = df_unique.groupby('sell_date').agg(
    num_sold=('product', 'nunique'),
    products=('product', lambda x: ','.join(sorted(x)))
).reset_index()

# 按日期排序
result = result.sort_values(by='sell_date')

# 打印结果
print(result)

2024.6.13

锂享生活

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
每日一题41：按日期分组消费产品

对于2020-05-30，出售的物品是 (Headphone, Basketball, T-shirt)，按词典序排列，并用逗号 ',' 分隔。对于2020-06-01，出售的物品是 (Pencil, Bible)，按词典序排列，并用逗号分隔。对于2020-06-02，出售的物品是 (Mask)，只需返回该物品名。编写解决方案找出每个日期、销售的不同产品的数量及其名称。该表没有主键(具有唯一值的列)。此表的每一行都包含产品名称和在市场上销售的日期。| 列名 | 类型 |
复制链接

扫一扫

专栏目录