3.利用Tensorflow进行回归问题的处理

本文通过波士顿房价数据集,演示如何使用TensorFlow进行回归问题的处理,包括数据归一化、模型创建、训练、预测及评估。采用的损失函数是MSE,评价标准是MAE。
摘要由CSDN通过智能技术生成

之前的两个tensorflow的案例都是分类问题,现在我们来讲回归问题,之前的分类问题都是返回离散值,回归问题返回的是连续值.

一.下载波士顿房价的数据集

代码如下:

import tensorflow as tf
from tensorflow import keras

import numpy as np

boston_housing=keras.datasets.boston_housing

(train_data,train_labels),(test_data,test_labels)=boston_housing.load_data()

#打乱数据,这里产生的是shape大小的0-1之间的浮点数,进行排序取下标
order=np.argsort(np.random.random(train_labels.shape))
train_data=train_data[order]
train_labels=train_labels[order]

不仅有下载数据的代码还有打乱数据的代码.

1.1 样本和特征

代码:

print("Training set:{}".format(train_data.shape))
print('Testing set:{}'.format(test_data.shape))
print(train_data[0])

结果:从结果来看,我们的训练集有404个样本,测试集有102个样本,每个样本都存在13个特征.展示第一个样本可以看出每一个特征的规模都不一样,需要归一化.

通过pandas这个库,来友好的展示前几个数据集的数据.

代码如下:

import pandas as pd
column_names=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE',
              'DIS','RAD','TAX','PTRATIO','B','LSTAT']

df=pd.DataFrame(train_data,columns=column_names)
print(df.head())

结果如下:

Training set:(404, 13)
Testing set:(102, 13)
[7.8750e-02 4.5000e+01 3.4400e+00 0.0000e+00 4.3700e-01 6.7820e+00
 4.1100e+01 3.7886e+00 5.0000e+00 3.9800e+02 1.5200e+01 3.9387e+02
 6.6800e+00]

1.2 标签

也就是多少美金

代码:展示前10个结果,以千为单位.

print(train_labels[0:10])

结果:

[32.  27.5 32.  23.1 50.  20.6 22.6 36.2 21.8 19.5]

二.归一化数据

归一化=(每一个特征-均值)/样本

代码:


                
  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值