目录
🍔 前言
踏入深度学习的奇妙世界,就像开启了一场探索未知的旅程。今天,我们将携手踏上一小段轻松而充满乐趣的入门之旅——价格分类。想象一下,通过神奇的神经网络,我们能够教会电脑理解并预测商品的价格区间,是不是既实用又令人兴奋呢?别担心复杂的数学公式,让我们以轻松愉悦的心态,一步步揭开深度学习的神秘面纱,从价格分类这个小案例开始,共同见证智能的力量吧!
案例背景🍼
小明创办了一家手机公司,他不知道如何估算手机产品的价格。为了解决这个问题,他收集了多家公司的手机销售数据。
我们需要帮助小明找出手机的功能(例如:RAM等)与其售价之间的某种关系。我们可以使用机器学习的方法来解决这个问题,也可以构建一个全连接的网络。
要求🍼
在这个问题中,我们不需要预测实际价格,而是一个价格范围,它的范围使用 0、1、2、3 来表示,所以该问题也是一个分类问题。
🍔 构建数据集
数据共有 2000 条, 其中 1600 条数据作为训练集, 400 条数据用作测试集。 我们使用 sklearn 的数据集划分工作来完成。并使用 PyTorch 的 TensorDataset 来将数据集构建为 Dataset 对象,方便构造数据集加载对象。
# 构建数据集
def create_dataset():
data = pd.read_csv('data/手机价格预测.csv')
# 特征值和目标值
x, y = data.iloc[:, :-1], data.iloc[:, -1]
x = x.astype(np.float32)
y = y.astype(np.int64)
# 数据集划分
x_train, x_valid, y_train, y_valid = \
train_test_split(x, y, train_size=0.8, random_state=88, stratify=y)
# 构建数据集
train_dataset = TensorDataset(torch.from_numpy(x_train.values), torch.tensor(y_train.values))
valid_dataset = TensorDa