第1关:数值计算基础
1.创建24个元素的随机整数数组arr,每个元素的值在[0,10)
2.改变数组维度为4*6的二维数组
3.将第一列和最后一列的元素值乘以2
4.将数组中的零值以及负值全部替换为-5
5.对数组按行求和并输出
import numpy as np
s=eval(input())
# 1.创建24个元素的随机整数数组arr,每个元素的值在[0,10)
np.random.seed(s)
############begin############
arr=np.random.randint(0,10,24)
#############end#############
#2.改变数组维度为4*6的二维数组
############begin############
arr=arr.reshape(4,6)
#############end#############
#3.将第一列和最后一列的元素值乘以2
############begin############
arr[:,0]=arr[:,0]*2
arr[:,-1]=arr[:,-1]*2
#############end#############
#4.将数组中的零值以及负值全部替换为-5
############begin############
arr[arr<=0]=-5
#############end#############
#5.对数组按行求和并输出
############begin############
arr=arr.sum(axis=1)
print(arr)
#############end#############
第2关:模型建立、训练及评估
1.从文件train.txt中读取训练集,从test.txt中读取测试集,最后一列数据为因变量,其余为自变量
2.建立并训练模型(normalize参数设为True)
3.输出模型参数(系数和截距),分别为一维数组形式和标量形式,所有值控制小数点后三位
4.输出模型的平均平方误差和R方,控制小数点后三位
大家在写的时候记得引入代码,注意三位小数写法,第三问第一个是标量,要变为列表。
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score
# 1.从文件train.txt中读取训练集,从test.txt中读取测试集
#最后一列数据为因变量,其余为自变量
############begin############
train = np.loadtxt('train.txt')
test = np.loadtxt('test.txt')
x_train = train[:,:-1]
y_train = train[:,-1]
x_test = test[:,:-1]
y_test = test[:,-1]
#############end#############
#2.建立并训练模型(normalize参数设为True)
############begin############
lr = LinearRegression(normalize=True)
lr.fit(x_train,y_train)
#############end#############
#3.输出模型参数(系数和截距),分别为一维数组形式和标量形式,所有值控制小数点后三位
############begin############
print(list((lr.coef_).round(3)))
print((lr.intercept_).round(3))
#############end#############
#4.输出模型的平均平方误差和R方,控制小数点后三位
############begin############
y_pred =lr.predict(x_test)
print((mean_squared_error(y_test,y_pred)).round(3))
print((r2_score(y_test,y_pred)).round(3))
#############end#############
第3关:模型效果可视化
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score
plt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一(替换sans-serif字体)
plt.rcParams['axes.unicode_minus'] = False # 步骤二(解决坐标轴负数的负号显示问题)
#x_test为测试集自变量,y_test为测试集因变量,predict为输入测试集预测出的结果
x_test=np.loadtxt('x_test.txt')
y_test=np.loadtxt('y_test.txt')
predict=np.loadtxt('predict.txt')
#可视化(参考编程要求)
#用散点图展示模型预测效果。每个点的横坐标表示房屋真实价格,纵坐标表示线性回归模型根据特征预测的结果,当二者值完全相等的时候就会落在虚线上。所以模型预测得越准确,则点离虚线越近
def draw_fig(filename):
plt.figure('fig1')
############begin############
plt.scatter(y_test,predict,c='blue')
plt.plot(y_test,y_test,color='black',linestyle=':')
plt.title('波士顿房价预测')
plt.xlabel('实际价格')
plt.ylabel('预测价格')
plt.savefig(filename)
plt.show()
#############end#############
特备鸣谢@某某灰