本例使用kaggle的“House Sales in King County, USA"数据集,共有21613笔房屋数据,每一笔数据有21个不同的信息,如图所示:
下载地址:
链接: https://pan.baidu.com/s/15OjQ5YHpooDaxkhFHfTpjg
提取码: tcg9
第1步,导入必要套件:
import os
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras import layers
第2步,读取数据并进行数据预处理
根据列表中第2列date数据提取“年、月、日”这3个有效信息,并放在列表最后,尔后丢弃id与date这2个无用信息。
data = pd.read_csv("kc_house_data.csv")
data['year'] = pd.to_numeric(data['date'].str.slice(0, 4))
data['month'] = pd.to_numeric(data['date'].str.slice(4, 6))
data['