python对数据集进行排序_tensorflow数据集：对一些数据进行排序，然后进行批处理...

最新推荐文章于 2022-08-16 17:44:18 发布

八决子

最新推荐文章于 2022-08-16 17:44:18 发布

阅读量590

点赞数

文章标签： python对数据集进行排序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31855625/article/details/113979648

版权

我的序列数据的长度范围很广。现在，我的数据集获取随机无序的序列，并将批处理填充到最长的序列。(参见下面的代码)

我想要的是：

1.)随机抽取20倍批量大小的序列

2.)按长度进行排序(长度可用“utt_length”表示)

3.)将“排序数据”分为20批

我的管道没有排序：dataset = tf.data.TFRecordDataset(self.state['train_data_TFR'])

dataset = dataset.map(self.parse,num_parallel_calls=5)

dataset = dataset.shuffle(buffer_size=10000, seed=seed)

dataset = dataset.map(Pipeline.__expand)

shape = {

"length": 1,

"num_of_turns": 1,

"utt_lengths": tf.TensorShape([None])

}

for turn in range(self.state['max_turns'] + 1):

shape["utt_" + str(turn)] = tf.TensorShape([None])

dataset = dataset.apply(tf.contrib.data.padded_batch_and_drop_remainder(self.state['batch_size'],

padded_shapes=shape))

dataset = dataset.map(Pipeline.__deflate)

示例：

^{pr2}$

我实现的内容显示在上面的代码中。这是我的管道没有这个分类。我不知道如何先获取“n倍于批大小”的数据，然后在该批数据之后将这些数据排序为“批大小”示例：/

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python对数据集进行排序_tensorflow数据集：对一些数据进行排序，然后进行批处理...

我的序列数据的长度范围很广。现在，我的数据集获取随机无序的序列，并将批处理填充到最长的序列。(参见下面的代码)我想要的是：1.)随机抽取20倍批量大小的序列2.)按长度进行排序(长度可用“utt_length”表示)3.)将“排序数据”分为20批我的管道没有排序：dataset = tf.data.TFRecordDataset(self.state['train_data_TFR'])datas...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。