初次接触深度学习,记录一点思考和想法,请大家多多指正。
首先是工具包的导入pycharm
这里我用到了numpy科学计算库,json轻量级的数据交换格式包,以及matplotlib绘图工具包
import numpy as np
import json
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
首先我们的目的是用13个有关因素预测房价,相当于有13个自变量x,1个输出y,我们要寻找这些x,与y之间的函数。
首先是数据的预处理
我们有大概500多个数据,类似于这样的形式,它们之间用空格分开。
使用np.fromdata来读取数据记录在data一维数组中,sep参数我猜测是这个函数读取数据的方式,如果有空格分开就代表这空格两边各有一个数据。之后将data由一维的数组用reshape函数转化为一个14*506的数组矩阵,再将其中的80%的数据用来训练,20%的数据用来测试。随后对数据进行归一化处理,归一化的目的为了将来取下降梯度计算的detla值更方便,这里我也不太明白是为什么。
def load_data():
datafile='/home/xiaobin0264/fzb/datafile/housing.data'
data=np.fromfile(datafile,sep=' ')