题目
某公司近几年来开发的产品利润收益受研发成本的影响,公司已有的部分数据存储在分组任务附件“实训项目1测试数据.xlsx”中。该公司计划在2021年为A产品投入研发经费10万元,请根据公司提供的已有数据,建立回归模型,预测2021年A产品的利润为多少?
1.步骤1:导入需要的库
- 导入pands库处理和读取Excel表格
- 导入matplotlib.pvplot库进行绘图
- 导入LinearRegression库建立线性回归模型
import pandas as pd #读取和处理Excel表格
import matplotlib.pyplot as plt #绘图
from sklearn.linear_model import LinearRegression #建立线性回归模型
2.读取数据
使用pandas库中的read_excel()函数读取保存公司研发成本和利润的excel表格,这里将表格命名为data.xlsx
data = pd.read_excel("data.xlsx") #读取表格
3.提取特征和目标变量
从data数据中将研发成本作为特征变量x,商品利润作为目标变量y。使用.values返回Numpy数组
x = data[['研发投入/元']].values
y = data[['商品利润/元']].values
4.建立线性回归模型和拟合模型
创建一个线性回归模型的对象用来拟合数据并进行预测。使用fit方法拟合线性回归模型。
model = LinearRegression()
model.fit(x,y)
5.预测2021年产品利润
使用训练好的模型进行预测,假设研发经费为10万元,使用predict方法得到预测值
profit_2021 = model.predict([[100000]])
print("预测2021年产品的利润为:",profit_2021)
6. 绘制图形
使用python的绘图库绘制研发成本和产品利润的图,直观得到预测数据
以下三个函数单独执行可以分别得到三种图形:散点图,预测曲线图,预测点图。
一起执行则得到合并图形
plt.scatter(x,y,color='blue') #绘制散点图
plt.plot(x,model.predict(x),color='red') #绘制趋势线
plt.scatter(100000,profit_2021,color='green') #绘制预测点