时间:2019-02-25
概述:销售预测
第一个使用Python完成的数据化运营案例——销售预测,依赖库:re、numpy、sklearn、matplotlib,程序输入:data.txt,程序输出:预测的销售量。
# 导入库
import re
import numpy
from sklearn import linear_model
from matplotlib import pyplot as plt
# 导入数据
fn = open("data.txt", "r")
all_data = fn.readlines()
fn.close()
# 数据预处理
x = []
y = []
for single_data in all_data:
tmp_data = re.split(" | ", single_data)
x.append(float(tmp_data[0]))
y.append(float(tmp_data[1]))
x = numpy.array(x).reshape([-1, 1])
y = numpy.array(y).reshape([-1, 1])
# 数据分析展示
plt.scatter(x, y)
plt.show()
# 数据建模
model = linear_model.LinearRegression()
model.fit(x, y)
# 模型评估
model_coef = model.coef_
model_intercept = model.intercept_
r2 = model.score(x, y)
# 销售预测
new_x = 84610
pre_y = model.predict(new_x)
print (pre_y)