获取和读取数据集
我们将通过pandas
库读入并处理数据
# 如果没有安装pandas,则反注释下面一行
# !pip install pandas
%matplotlib inline
import torch
import torch.nn as nn
import numpy as np
import pandas as pd
import sys
sys.path.append("..")
import d2lzh_pytorch as d2l
print(torch.__version__)
torch.set_default_tensor_type(torch.FloatTensor)
利于pandas读取解压后的数据
train_data = pd.read_csv('../../data/kaggle_house/train.csv')
#读取../../data/kaggle_house/train.csv位置的数据赋给train_data
test_data = pd.read_csv('../../data/kaggle_house/test.csv')
#读取../../data/kaggle_house/test.csv位置的数据赋给test_data
train_data.shape # 输出 (1460, 81)
test_data.shape # 输出 (1459, 80)
train_data.iloc[0:4, [0, 1, 2, 3, -3, -2, -1]]
all_features = pd.concat((train_data.iloc[:, 1:-1], test_data.iloc[:, 1:]))