《Pytorch深度学习实践》P8 Dataset and DataLoader 笔记+代码+作业：DataLoader的使用方法、ppt代码、Titanic数据生存预测作业及改进

from torch.utils.data import DataLoader

# 假设有一个自定义的数据集 DiabetesDataset
train_loader = DataLoader(dataset=train_dataset, batch_size=32, shuffle=True)

for batch_data, batch_labels in train_loader:
    pass

主要参数：

dataset: 传入 Dataset 对象，它定义了数据集（如你自定义的 TitanicDataset）。
batch_size: 每个批次的数据量，默认是 1。通常会根据显存大小和训练需要设置合适的批次大小。
shuffle: 是否在每个 epoch 开始时打乱数据。如果设置为 True，会在每次迭代时随机打乱数据。对于训练集来说，通常会设置为 True 以增加模型泛化能力。
num_workers: 加载数据时使用的子进程数量。默认为 0，表示使用主进程加载数据。增加 num_workers 数量可以加速数据加载（特别是数据预处理时间较长时）。
drop_last: 如果 True，则丢弃最后一个批次的数据，如果该批次的样本数量不足 batch_size。默认为 False。
pin_memory: 如果设置为 True，会将数据加载到固定内存中，有助于加速 GPU 的数据传输。常用于 GPU 训练。