赞赞童鞋鼓励我一定要勤更勤更勤更,好的那就更一个。虽然真的好累……
任务是酱紫的,有两个CSV文件,要解决4个问题:
Q1:2014年9月哪个店铺的总revenue最高?
Q2:2014年夏天哪个item_category的revenue最高?
Q3:有多少item的价格一直没变过?
Q4:2014年12月,25号商店的日销量的柱状图,并求方差
OK,let's go.
import pandas as pd
import numpy as np
import os
import time,datetime
import matplotlib.pyplot as plt
DATA_FOLDER = 'D:/LFTK/W1/'
transactions = pd.read_csv(os.path.join(DATA_FOLDER, 'sales_train.csv.gz'))
items = pd.read_csv(os.path.join(DATA_FOLDER, 'items.csv'))
#看看transactions长啥样#
transactions.head()
date | date_block_num | shop_id | item_id | item_price | item_cnt_day | |
---|---|---|---|---|---|---|
0 | 02.01.2013 |