hnu计算机与人工智能概论5.19

howell（Python）

已于 2023-05-23 22:27:06 修改

阅读量2.3k

点赞数 4

文章标签：算法数据结构

于 2023-05-23 22:23:34 首次发布

本文链接：https://blog.csdn.net/howell55/article/details/130836672

版权

第1关：数值计算基础

1.创建24个元素的随机整数数组arr，每个元素的值在[0,10)

2.改变数组维度为4*6的二维数组

3.将第一列和最后一列的元素值乘以2

4.将数组中的零值以及负值全部替换为-5

5.对数组按行求和并输出

import numpy as np

s=eval(input())
# 1.创建24个元素的随机整数数组arr，每个元素的值在[0,10)
np.random.seed(s)
############begin############
arr=np.random.randint(0,10,24)
#############end#############

#2.改变数组维度为4*6的二维数组
############begin############
arr=arr.reshape(4,6)
#############end#############

#3.将第一列和最后一列的元素值乘以2
############begin############
arr[:,0]=arr[:,0]*2
arr[:,-1]=arr[:,-1]*2
#############end#############

#4.将数组中的零值以及负值全部替换为-5
############begin############
arr[arr<=0]=-5
#############end#############

#5.对数组按行求和并输出
############begin############
arr=arr.sum(axis=1)
print(arr)
#############end#############

第2关：模型建立、训练及评估

1.从文件train.txt中读取训练集，从test.txt中读取测试集，最后一列数据为因变量，其余为自变量

2.建立并训练模型(normalize参数设为True)

3.输出模型参数(系数和截距)，分别为一维数组形式和标量形式,所有值控制小数点后三位

4.输出模型的平均平方误差和R方，控制小数点后三位

大家在写的时候记得引入代码，注意三位小数写法，第三问第一个是标量，要变为列表。

import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score
# 1.从文件train.txt中读取训练集，从test.txt中读取测试集
#最后一列数据为因变量，其余为自变量
############begin############
train = np.loadtxt('train.txt')
test = np.loadtxt('test.txt')
x_train = train[:,:-1]
y_train = train[:,-1]
x_test = test[:,:-1]
y_test = test[:,-1]
#############end#############

#2.建立并训练模型(normalize参数设为True)
############begin############
lr = LinearRegression(normalize=True)
lr.fit(x_train,y_train)
#############end#############

#3.输出模型参数(系数和截距)，分别为一维数组形式和标量形式,所有值控制小数点后三位
############begin############
print(list((lr.coef_).round(3)))
print((lr.intercept_).round(3))
#############end#############

#4.输出模型的平均平方误差和R方，控制小数点后三位
############begin############
y_pred =lr.predict(x_test)
print((mean_squared_error(y_test,y_pred)).round(3))
print((r2_score(y_test,y_pred)).round(3))
#############end#############

第3关：模型效果可视化

import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score

plt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一（替换sans-serif字体）
plt.rcParams['axes.unicode_minus'] = False  # 步骤二（解决坐标轴负数的负号显示问题）

#x_test为测试集自变量，y_test为测试集因变量，predict为输入测试集预测出的结果
x_test=np.loadtxt('x_test.txt')
y_test=np.loadtxt('y_test.txt')
predict=np.loadtxt('predict.txt')

#可视化(参考编程要求)
#用散点图展示模型预测效果。每个点的横坐标表示房屋真实价格，纵坐标表示线性回归模型根据特征预测的结果，当二者值完全相等的时候就会落在虚线上。所以模型预测得越准确，则点离虚线越近
def draw_fig(filename):
    plt.figure('fig1')
############begin############
    plt.scatter(y_test,predict,c='blue')
    plt.plot(y_test,y_test,color='black',linestyle=':')
    plt.title('波士顿房价预测')
    plt.xlabel('实际价格')
    plt.ylabel('预测价格')
    plt.savefig(filename)
    plt.show()
#############end#############

特备鸣谢@某某灰