教你使用百度深度学习框架PaddlePaddle完成波士顿房价预测（新手向）

大家平常接触到的深度学习框架可能有PyTorch、TensorFlow等等，今天的飞桨是百度研制的一款开源的深度学习框架，个人认为可以满足日常学习，另外，百度还配套有专门的线上实训平台aistudio，提供了丰富的课程以及免费的GPU（百度打钱，hahaha）十分良心。一下是PaddlePaddle的API以及GitHub地址，大家没事可以多看看挺有意思的。

三、波士顿房价预测模型

波士顿房价预测项目是一个经典的入门级项目，我们认为波士顿地区的房价受多种因素影响（人均犯罪率，一氧化氮浓度等等），我们收集了房价随各种因素变化而变化的数据，现在我们需要使用计算机根据这些数据来设计一个房价受各因素影响而变化的模型。对于预测问题，可以根据预测输出的类型是连续的实数值，还是离散的标签，区分为回归任务和分类任务。因为房价是一个连续值，所以房价预测显然是一个回归任务。下面我们尝试用最简单的线性回归模型解决这个问题，并用神经网络来实现这个模型。

构建神经网络的基本步骤如下图所示，我们将会用飞桨框架来搭建这个项目，并对其中的基本概念进行解释

数据处理

数据处理包含五个部分：数据导入、数据形状变换、数据集划分、数据归一化处理和封装load data函数。数据预处理后，才能被模型调用，可以说一个好的数据处理方式是优秀网络搭建的基石。

我们使用的数据的格式是一些506*14的数字

其中前13列代表影响因素，最后一列是房价（影响因素具体如下）

话不多说直接上代码

数据导入

# 导入需要用到的package
# 加载飞桨、Numpy和相关类库
import paddle
import paddle.fluid as fluid
import paddle.fluid.dygraph as dygraph
from paddle.fluid.dygraph import Linear
import numpy as np
import os
import random
# 读入训练数据
datafile = './work/housing.data'
data = np.fromfile(datafile, sep=' ')
print(data)

# 在文件里的数据已经转化为Python中的ndarry格式了
[6.320e-03 1.800e+01 2.31