微信公众号:机器学习养成记搜索添加微信公众号:chenchenwings
《菜鸟侦探挑战数学分析》小案例,python实现第五弹~~
案件回顾
1,现有冰激凌店一年的历史销售数据
2,数据包括单日的销售量、气温、周几(问题:如何用这些数据预测冰激凌的销量?)
模拟实验与分析
将数据存储为csv格式,导入python。并画出散点图,观察气温和销售量的关系。import pandas as pd
icecream = pd.read_csv("icecream.csv")
import matplotlib.pyplot as plt
import pylab
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.scatter(icecream.iloc[:,1],icecream.iloc[:,0])
plt.xlabel("气温")
plt.ylabel("销售量")
pylab.show()
计算两者间的相关系数。icecream.iloc[:,0:2].corr()
结果为:销售量 ? ? ? 气温
销售量 1.000000 ? 0.844211
气温 ? ? 0.844211 ? 1.000000
销售量和气温的相关系数为0.84,结合散点图,认为两者相关。下面用回归