Pytorch深度学习实践第八讲课后习题 训练titanic数据集

博主分享了使用Pytorch对Kaggle Titanic数据集进行深度学习实践的课后习题,涵盖了神经网络的应用。
摘要由CSDN通过智能技术生成

本节没有课程传送门,算是博主根据老师讲的内容做的作业。

数据集传送门 Kaggle Titanic dataset

	这里对数据集进行了一些处理,首先第一行不能是属性名而非特征,不能使用所以在第一个表格
前加了'#',另外有一些无用特征比如乘客姓名这里选择了直接跳过,最后在处理过发现np.loadtxt
函数不能识别'str'类型数据,所以空数据用‘-1’进行了替换,数据集最后一项只有三个类别,所以用
'0','1','2'标记替换。下面是处理后的训练集截图

处理后的表格截图

import torch
from  torch.utils.data import Dataset
from  torch.utils.data import DataLoader
import numpy as np
import matplotlib.pyplot as plt
#程序运行过程会有一些警告,这个没问题。

class titanicDataset(Dataset):
    def __init__(self,filepath):
        x = np.loadtxt(filepath, delimiter=',', dtype=np.float32, usecols=(2, 5, 6, 7, 8, 10, 12))
        #上面只取有效特征,类似人名,票号等唯一特征对训练没用就没取。
        y = np.loadtxt(filepath, delimiter=',', dtype=np.float32, usecols=1)
        # 'delimiter'为分隔符
        y = y[:, np.newaxis]
        #这里增加一维,不然计算loss的时候维度不同会报错
        
        self.x_data = torch.from_numpy(x)
        self.y_data = torch.from_numpy(y)
        self.len =
  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 16
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值