之前我们其实已经写过了,这次既然原文单独列了一章,我们也来再写一次好了。原文希望我们把RMSE压到110以下,我这里验证集的RMSE 115左右,因随机数种子最低降到过112左右,在设定好种子的情况下seed(1) 验证集的rmse在116左右。
上次我们用xs1,xs2,xs3...来得到特征集的tensor,如若columns太多,操作起来很繁琐,这次我把tensor压到了一个列表里,然后通过concat来组合。
import tensorflow as tf
import numpy as np
import pandas as pd
from tensorflow.data import Dataset
df = pd.read_csv('california_housing_train.csv')
df['per_rooms'] = df['total_rooms'] / df['population']
df['median_house_value'] /= 1000
df = df.reindex(np.random.permutation(df.index))
df = df.sort_index()
tf.set_random_seed(1)
def train_validation(df):
features = df[['longitude', 'latitude', 'housing_median_age',
'total_rooms', 'total_bedrooms', 'population', 'households',
'median_income', 'per_rooms']]
targe