nmt 观察

最新推荐文章于 2021-03-01 17:14:41 发布

qq_28808697

最新推荐文章于 2021-03-01 17:14:41 发布

阅读量248

点赞数

分类专栏： tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28808697/article/details/80774771

版权

tensorflow 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

1、https://github.com/tensorflow/nmt/issues/183

中讲解了如何使用google的nmt。即https://github.com/tensorflow/nmt

2、https://github.com/brightmart/machine_translation/blob/master/tokeniz_chinese2.py使用的是jieba分词

而https://github.com/hxsnow10/nmt说using nltk and chineses tokenizer.

3、https://github.com/mingfengwuye/nmt/blob/master/nmt/scripts/wmt17-zh-en.sh

有下载中英文翻译的数据并分词。但是分词的效果很差。

4、subword-nmt, Subword神经网络翻译

5、https://github.com/tensorflow/nmt/blob/tf-1.4/nmt/scripts/download_iwslt15.sh

是直接下载已经分词好后的vocba

6、tensor2tensor中英文分词的结果与nmt英越语分词的结果差别有：前者是<pad><EOS> 后者是<unk><s></s>。另外，前者字典里的词都有引号，去除引号参考：python 修改文件中的内容 python 去除字符串两端的引号

将前者改成后者的样式，但是对实验结果没有影响。

7、基于注意力机制，机器之心带你理解与训练神经机器翻译系统

8、https://github.com/tensorflow/tensor2tensor/blob/master/tensor2tensor/data_generators/README.md

讲解了data_generate

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
nmt 观察

1、https://github.com/tensorflow/nmt/issues/183中讲解了如何使用google的nmt。即https://github.com/tensorflow/nmt
复制链接

扫一扫

专栏目录

博客等级

码龄9年

345
原创

175
点赞

525
收藏

81
粉丝

关注

私信

热门文章

分类专栏

最新评论

sql 笔记
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性。
go error
CSDN-Ada助手: Go 技能树或许可以帮到你：https://edu.csdn.net/skill/go?utm_source=AI_act_go
计算机网络学习笔记--交换机、路由器
CSDN-Ada助手: 如何保护企业内部数据的机密性和完整性？
网络相关概念
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
操作系统学习笔记--信号量（整型信号量、记录型信号量）
qq_28808697: v操作是从-1加到0，有一个进程需要被唤醒

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。