1读取数据
%matplotlib notebook
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# read file kit
from sklearn.utils import shuffle
#洗牌
# read file
df=pd.read_csv("data/boston.csv",header=0)
# show data summary数据摘要
print(df.describe())
2数据准备
# 获取df的值
df=df.values
#把df转换为np的数组格式
df=np.array(df)
# x_data前12列特征数据
x_data=df[:,:12]
#y_data为最后一列标签数据
y_data=df[:,12]
3构建模型
行不知道多少行,列确定有12列,这个有比较好的适应性,可以一个或多个样本
命名空间,把内部节点打包在一起使计算图简单一些 .
#定义了一个命名空间
with tf.name_scope("Model"):
#w初始化为shape=(12,1)的随机数
w=tf.Variable(tf.random_normal([12,1],stddev=0.01),name="W")
# b初始化
b=tf.Variable(1.0,name='b')
#w和x矩阵相乘
def model(x,w,b):
return tf.matmul(x,w)+b
#预测计算操作,前向计算节点
pred=model(x,w,b)
4模型训练
打乱是因为害怕只记得顺序,而不是对应的目标所产生的的结果,如认甲骨文,只记得第一个字是金,换了顺序还以为第一个是金,以为答案正确了,但是只与顺序相关。
for epoch in range(train_epochs):
loss_sum=0.0
for xs,ys in zip(x_data,y_data):
xs=xs.reshape(1,12)
ys=ys.reshape(1,1)
_,loss=sess.run([optimizer,loss_function],feed_dict={x:xs,y:ys})
loss_sum=loss_sum+loss
xvalues,yvalues=shuffle(x_data,y_data)
b0temp=b.eval(session=sess)
w0temp=w.eval(session=sess)
loss_average=loss_sum/len(y_data)
print("epoch=",epoch+1,"loss=",loss_average,"b=",b0temp,"w=",w0temp)
出现作业2的问题,解决方法
探究训练异常的原因:从梯度下降讲起
波士顿房价有12个变量,把它缩小为两个变量
范围不确定,w超出正常边界
特征值取值范围比较悬殊,当不做归一化就会出现这个情况