【知识拓展】机器学习基础(二)：什么是模型、自定义模型、模型训练、模型调优

本文链接：https://blog.csdn.net/dopapapa/article/details/139219233

前言

接上文，前文对模型没有过多介绍，随着看的资料增多，对模型有了更多的自我认识，记录一下。要了解模型，我们先从零开始创建一个模型开始：

最简单的方法是使用Python和scikit-learn库。关于scikit-learn库，在这做个简单介绍，类似的库和框架有很多如NumPy、Pandas、TensorFlow、PyTorch，这些不是本文重点，后续有必要再补充，这里不做详细介绍。

Scikit-learn

Scikit-learn（以前称为scikits.learn，也称为sklearn）是一个强大的Python机器学习库，它集成了众多简单高效的机器学习算法，通过一套共用的接口进行调用，极大地方便了机器学习的应用和研究。

一个简单的案例

以下是一个简单的代码示例，演示如何创建和训练一个线性回归模型来预测数据。主要是为了方便大家更好的理解模型。它包括了如下内容：

test.py

主要包括准备数据集、创建和训练模型、评估模型性能、生成模型文件

# 安装scikit-learn库
# 运行以下命令来安装scikit-learn库，如果你还没有安装它：
# !pip install scikit-learn

# 导入必要的库
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import joblib

# 生成一个简单的数据集
# 假设我们有一些简单的线性数据，y = 2x + 1
X = np.array([[i] for i in range(10)])  # 特征（Feature）
y = np.array([2*i + 1 for i in range(10)])  # 标签（Label）

# 将数据集分成训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建线性回归模型
model = LinearRegression()

# 训练模型
model.fit(X_train, y_train)

# 使用测试集进行预测
y_pred = model.predict(X_test)

# 评估模型性能
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")


# 保存模型
joblib.dump(model, 'linear_regression_model.pkl')

test2.py

加载模型，并输入内容，测试输出结果

from joblib import load

# 加载模型
model = load('linear_regression_model.pkl')

# 使用模型进行预测
# 假设你有一个名为X的输入数据，可以这样进行预测：
predictions = model.predict([[10],[11]])

print(predictions)