按月统计1-4月的销售总额后,进行销售总额与广告投入的关系分析。
5月份该超市计划投入20000元广告费,请预测5月份的销售总额,并绘制图表。
import pandas as pd
from sklearn import linear_model
import matplotlib.pyplot as plt
data=pd.read_excel('某超市销售数据.xlsx')
datax=pd.read_excel('广告支出.xls')
data.dropna(axis=0,how="any",inplace=True)
df=data[['销售日期','销售金额']]
data["销售金额"]=data["销售金额"].astype(float)
data["销售数量"]=data["销售数量"].astype(float)
data['销售总额'] = data['销售数量'] * data['销售金额']
print(data['销售总额'] )
a= data.groupby(['销售月份'])
b=a['销售总额'].sum()
x=pd.DataFrame(datax["支出"])
y=pd.DataFrame(b.values)
clf=linear_model.LinearRegression(fit_intercept=True,normalize=False)
clf.fit(x,y)
w=clf.coef_
b=clf.intercept_
y5=20000*w+b
print(y5)
y_pred=clf.predict(x)
print(y_pred)
plt.scatter(x,y,color='red')#真实值散点图
plt.plot(x,y_pred)
plt.show()