不等长dataframe转为numpy

pytorch:

data_loader = DataLoader(
            data_set,
            batch_size=batch_size,
            shuffle=shuffle_flag,
            num_workers=args.num_workers,
            drop_last=drop_last,
            collate_fn=lambda x: collate_fn(x, max_len=args.seq_len)
        )

在dataloader的时候使用collate_fn

tensorflow

hist = self.model.fit(x_train, y_train, batch_size=mini_batch_size, epochs=self.nb_epochs,
                                  verbose=self.verbose, validation_data=(x_val, y_val), callbacks=self.callbacks)

输入的就得是numpy了,所以需要单独处理不等长dataframe转numpy

    max_seq_len = int(np.max(lengths[:, 0]))
    data = np.zeros((df.shape[0], df.shape[1], max_seq_len))
    for i in range(df.shape[0]):
        length = df.iloc[i].apply(len).values
        print('len',length)
        for j in range(df.shape[1]):
            padded_seq = np.pad(df.iloc[i, j], (0, max_seq_len - length[j]), 'constant', constant_values=np.nan)
            data[i, j, :] = padded_seq
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值