PyTorch深度学习（B站刘二大爷）第八讲作业——Kaggle网站泰坦尼克号Titanic

By_Liu

已于 2022-05-31 15:56:38 修改

阅读量1.1k

点赞数 1

文章标签： pytorch 深度学习 python

于 2022-05-31 15:52:25 首次发布

本文链接：https://blog.csdn.net/By_Liu/article/details/125066919

版权

kaggle没有notebook的文件夹系统让我很不满意，决定以后把自己练习的过程都搬上csdn。

1.引入库

import numpy as np
import pandas as pd
import torch 
from torch.utils.data import Dataset #抽象类 被继承
from torch.utils.data import DataLoader #加载数据

2.准备数据集

class TitanicDataset(Dataset):
    
    def __init__(self,filepath):
        xy = pd.read_csv(filepath) 
        self.len = xy.shape[0] # xy.shape（）可以得到xy的行列，[0]取行，[1]取列
        #选取需要的特征
        feature = ["Pclass", "Sex", "SibSp", "Parch", "Fare"]
        
        # xy[feature]的类型是DataFrame,先进行独热表示，然后转成array,最后转成tensor用于进行矩阵计算。
        self.x_data = torch.from_numpy(np.array(pd.get_dummies(xy[feature]))) 
        self.y_data = tor