关于tensorflow dataset API(map) 的一些学习记录----NMT

关于tensorflow dataset API(map) 的一些学习记录----NMT

dataset最基本的功能是创建数据集及使用数据集。
创建数据集:
1 `#词表
   src_vocab_table = lookup_ops.index_table_from_tensor(tf.constant(["a", "b", "c", "eos", "sos"]))
   src_eos_id tf.cast(src_vacab_table.look_up(tf.constant("eos")), tf.int32)
   src_sos_id tf.cast(src_vacab_table.look_up(tf.constant("sos")), tf.int32)
   
   #源数据集及目标数据集
   src_dataset = tf.data.Dataset.from_tensor_slices(tf.constant(["a b c", "c a", "d", "f, e, a, g"]))
   tgt_dataset = tf.data.Dataset.from_tensor_slices(tf.constant(["a b", "b c", "", "c c"]))
  
   #一些列操作
   src_tgt_dataset = tf.data.Dataset.zip((src_dataset, tgt_dataset))
   ##按空格分开
   src_tgt_dataset = src_tgt_dataset.map(lmabda src, tgt: (tf.string_split([src]).values), tf.string_split([tgt]).values) 
   ##将源数据集集目标数据集转换为词表中对应的id
   src_tgt_dataset = src_tgt_dataset.map(lambda src, tgt: (tf.cast(src_vocab_table.lookup(src), tf.int32), tf.cast(src_vocab_table.lookup(tgt), tf.int32)))
   ##对目标数据集添加起始及结束符标志sos/eos
   ##在每一个元素前后均添加了sos或是eos,具体详见下边的运行结果
   src_tgt_dataset = src_tgt_dataset.map(lambda src, tgt: (src, tf.constant(([src_sos_id]), 0), tf.constant((tgt, [src_eos_id]), 0)))

   #通过迭代器访问dataset中的下一个元素
   iterator = src_tgt_dataset.make_initializable_iterator()
   ret = iterator.get_next()

   #创建会话
   With tf.Session() as sess:
         sess.run(tf.tables_initializer())
         sess.run(tf.iterator.initializer)
         try:
               while True:
                      ret = sess.run(ret)
                      print(ret)
         except tf.errors.OutofRangeError:
               print("end!")`

运行结果如下:
(array([2, 2, 0], dtype=int32), array([4, 0, 1], dtype=int32), array([0, 1, 3], dtype=int32))
(array([2, 0], dtype=int32), array([4, 1, 2], dtype=int32), array([1, 2, 3], dtype=int32))
(array([-1], dtype=int32), array([4], dtype=int32), array([3], dtype=int32))
(array([-1, -1, 0, -1], dtype=int32), array([4, 2, 2], dtype=int32), array([2, 2, 3], dtype=int32))

分析:

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值