抱歉各位,期末周的任务比较多,最近都没空刷数据类编程的题了,在接下来的暑假中,我会坚持保持训练和更优质的更新的。
题目来源于力扣:
1795. 每个产品在不同商店的价格 - 力扣(LeetCode)
题目要求:
表:Products
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| product_id | int |
| store1 | int |
| store2 | int |
| store3 | int |
+-------------+---------+
在 SQL 中,这张表的主键是 product_id(产品Id)。
每行存储了这一产品在不同商店 store1, store2, store3 的价格。
如果这一产品在商店里没有出售,则值将为 null。
请你重构 Products 表,查询每个产品在不同商店的价格,使得输出的格式变为(product_id, store, price) 。如果这一产品在商店里没有出售,则不输出这一行。
输出结果表中的 顺序不作要求 。
查询输出格式请参考下面示例。
示例 1:
输入:
Products table:
+------------+--------+--------+--------+
| product_id | store1 | store2 | store3 |
+------------+--------+--------+--------+
| 0 | 95 | 100 | 105 |
| 1 | 70 | null | 80 |
+------------+--------+--------+--------+
输出:
+------------+--------+-------+
| product_id | store | price |
+------------+--------+-------+
| 0 | store1 | 95 |
| 0 | store2 | 100 |
| 0 | store3 | 105 |
| 1 | store1 | 70 |
| 1 | store3 | 80 |
+------------+--------+-------+
解释:
产品 0 在 store1、store2、store3 的价格分别为 95、100、105。
产品 1 在 store1、store3 的价格分别为 70、80。在 store2 无法买到。
特殊代码melt的解释:
这个代码用来对DataFrame从宽格式(wide format)转换为长格式(long format)。在处理数据的格式和时间序列的数据非常有用。
-基本语法:
pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None)
-参数解释:
frame
:要进行重塑操作的DataFrame。id_vars
:可选参数,是一个列名或列名的列表,用于唯一标识每行的变量。这些列将保留在输出的DataFrame中,而不会被转换。value_vars
:可选参数,是一个列名或列名的列表,用于选择要解除重塑的列。如果未指定,则使用除id_vars
以外的所有列。var_name
:生成的DataFrame中用于存储value_vars
列名的列的名称。默认为'variable'
。value_name
:生成的DataFrame中用于存储value_vars
值的列的名称。默认为'value'
。col_level
:如果输入的DataFrame是多级(例如具有多级列索引),则使用此参数来指定在哪个级别上应用重塑操作。
思路流程:
首先,题目我们可以很清晰地看到要求我们对宽格式转化为长格式,可以清楚的要用到melt函数:由于主键是product_id(产品Id),所以我们的id_vars用作唯一标识的数据为
product_id,可见要解除的列为store1,store2,store3,这里的参数value_cars可以用列表将这三个列进行解除。
那么列名会变成系统自动新建列的值,而被解除列名的值会自动分类统计到另一个系统自动生成的列表中,接下来我们只需要使用var_name和value_name参数对列名列表和值列表的列标题进行重命名即可。
最后注意删除空值,满足数据需求
代码实现:
import pandas as pd
def rearrange_products_table(products: pd.DataFrame) -> pd.DataFrame:
a=pd.melt(products,id_vars='product_id',value_vars=['store1','store2','store3'],var_name='store',value_name='price').dropna()
return a
可见利用melt可以进行简单的数据转置,可以在未来办公中更快捷,更便利的应对各种复杂的数据