导入CSV格式数据,并将年月日分开。
将csv格式数据导入为dataframe格式。
并且,将date columne中的年月日分拆。
首先确保date columne中的格式是datetime格式。
import pandas as pd
#pd.set_option('display.max_rows', None)
df = pd.read_csv(r"D:\xxx.csv",parse_dates=["date"])
df["year"] = df.date.apply(lambda x:x.year)
df["month"] = df.date.apply(lambda x:x.month)
df["day"] = df.date.apply(lambda x:x.day)
删除特定行
将每一行中某一columne如果为0,则删除该行。
df=df.drop(df[df["xxx"] == 0].index)
根据年和月进行分组
使用groupby函数。并且针对size columne进行求和。
month_size = df["size"].groupby([df["year"],df["month"]]).sum()
day_size = df["size"].groupby([df["year"],df["month"],df["day"]]).sum()