python日期处理、groupby聚合、求最大值、方差

本文通过Python解决四个数据处理问题:找出2014年9月销售额最高的店铺,2014年夏天收入最高的商品类别,统计价格未变动的商品数量,以及绘制2014年12月25日商店销售柱状图并计算方差。在分析中,发现2014年12月29日无销量,而30日销量突然增加,原因未知。
摘要由CSDN通过智能技术生成

赞赞童鞋鼓励我一定要勤更勤更勤更,好的那就更一个。虽然真的好累……

任务是酱紫的,有两个CSV文件,要解决4个问题:

Q1:2014年9月哪个店铺的总revenue最高?

Q2:2014年夏天哪个item_category的revenue最高?

Q3:有多少item的价格一直没变过?

Q4:2014年12月,25号商店的日销量的柱状图,并求方差

OK,let's go.

import pandas as pd
import numpy as np
import os
import time,datetime
import matplotlib.pyplot as plt

DATA_FOLDER = 'D:/LFTK/W1/'

transactions    = pd.read_csv(os.path.join(DATA_FOLDER, 'sales_train.csv.gz'))
items           = pd.read_csv(os.path.join(DATA_FOLDER, 'items.csv'))
#看看transactions长啥样#
transactions.head()
  date date_block_num shop_id item_id item_price item_cnt_day
0 02.01.2013
Python中,计算平均值、方差和最大最小值是常见的数据分析任务,可以使用内置的函数轻松完成。以下是三种操作的方法: 1. 平均值(Average): 可以使用`sum()`函数加总所有数值,然后除以数量(列表长度)来计算。例如: ```python numbers = [1, 2, 3, 4, 5] average = sum(numbers) / len(numbers) ``` 或者使用`statistics`模块中的`mean()`函数,它是专门为统计目的设计的: ```python import statistics numbers = [1, 2, 3, 4, 5] average = statistics.mean(numbers) ``` 2. 方差(Variance): 方差测量了数据点与平均值之间的偏离程度。可以使用`numpy`库的`var()`函数或`statistics`模块的`variance()`方法,如果列表已排序,需先调用`numpy.array()`或`list()`: ```python import numpy as np numbers = [1, 2, 3, 4, 5] variance = np.var(numbers) # 或者 variance = statistics.variance(numbers) # 如果没有numpy: variance = sum((x - average) ** 2 for x in numbers) / len(numbers) ``` 3. 最大值(Max)和最小值(Min): Python内建函数`max()`和`min()`可以直接找出列表中的最大值和最小值: ```python max_value = max(numbers) min_value = min(numbers) ``` 或者同样地,你可以使用`numpy`库的`amax()`和`amin()`,或者`statistics`模块的`max()`和`min()`,但注意后者只对可迭代对象有效。 如果你有具体的数据列表,我可以帮你演示如何应用这些方法。如果你需要计算特定类型的数值(如整数、浮点数或字符串中的数字),可能需要额外处理。现在,请告诉我你是否有具体的数值列表,或者需要进一步的解释。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值