自然语言处理大菜鸟--HsingWang

自然语言处理 & 机器翻译 & http://hlt.suda.edu.cn/~xwang/

排序:
默认
按更新时间
按访问量

国内外自然语言处理(NLP)研究组

  *博客地址 http://blog.csdn.net/wangxinginnlp/article/details/44890553 *排名不分先后。收集不全,欢迎留言完善。   中国大陆地区: 腾讯人工智能实验室(Tencent AI Lab)       https://ai.t...

2015-04-05 20:26:26

阅读数:22720

评论数:6

ICTCLAS2014 C++版本 的使用方法

这个工具是什么?先看看他的官方介绍吧: NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 虽然介...

2013-12-13 13:30:06

阅读数:10983

评论数:30

ICTCLAS2013 Java版本的使用方法

这个工具是什么?先看看他的官方介绍吧: NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 c++版...

2013-04-07 17:47:12

阅读数:15144

评论数:70

Adaptation for Neural Machine Translation

目标:7月把NMT adaptation文章通读下 场景:假设储备了大量新闻领域双语语料,少量科技领域双语语料(或者没有),科技领域单语语料(大量、少量或者没有)的大菜鸟翻译公司,接到一个科技领域的翻译项目。如何使用现有资源去尽可能的把科技领域的翻译做好。 问题:这里的科技领域就是in-dom...

2018-07-17 15:50:44

阅读数:39

评论数:0

T2T Transformer 笔记

讨论:https://www.jiqizhixin.com/articles/2017-06-28-5https://ricardokleinklein.github.io/2017/11/16/Attention-is-all-you-need.html1. Mutli GPU 和 Single...

2017-12-08 17:44:33

阅读数:493

评论数:1

2017/0910 实验结果记录

实验1. Adam+LN(LN没有对context vector和source side的input做) 20000 BLEU score = 0.2947 21000 BLEU score = 0.3159 22000 BLEU score = 0.3109 23000 BLEU score =...

2017-09-25 11:52:30

阅读数:379

评论数:0

深度学习中Dropout和Layer Normalization技术的使用

两者的论文: Dropout:http://www.jmlr.org/papers/volume15/srivastava14a/srivastava14a.pdf Layer Normalization:  https://arxiv.org/abs/1607.06450 两者的实现(以...

2017-09-24 20:53:33

阅读数:1409

评论数:0

神经机器翻译中的领域自适应问题 Domain adaptation for NMT

相关论文: 1. Stanford Neural Machine Translation Systems for Spoken Language Domains.  Minh-Thang Luong and Christopher D. Manning.   http://www.statm...

2017-08-30 16:00:12

阅读数:493

评论数:0

深度学习训练中cost突然出现NaN

问题:在深度学习训练中,之前的cost是正常的,突然在某一个batch训练中出现Nan。 网络搜索的资料: 1. How to avoid that Theano computing gradient going toward NaN https://stackoverflow.com/quest...

2017-08-23 17:26:16

阅读数:1090

评论数:0

网页正文提取工具Beautiful Soup

Beautiful Soup是什么? Beautiful Soup is a Python library for pulling data out of HTML and XML files. It works with your favorite parser to provide idio...

2017-07-06 15:35:12

阅读数:324

评论数:0

深度学习中Dropout策略

在写系统时候遇到一个问题:模仿的版本在测试阶段,把所有权重乘以一个保留概率(做法1)。而GJH他看的Keras里面测试阶段什么都不做(做法2),所以比较好奇,怎么做法不同? 但是随手搜了几个中文博客,都是按做法1来的,训练阶段按保留概率随机生成一个保留矩阵(元素要么0-丢弃,要么1-保留),然...

2017-05-23 16:41:54

阅读数:1225

评论数:1

组内NLP讨论班阶段总结

讨论班进行了三期了,效果比想象的要好很多。但也遇到不少问题: 1. 公式推导和编码实现     困惑是在讲解模型过程中,不可避免地涉及公式推导和编码实现。讨论班上是否对公式推导进行讲授,讨论班后是否组织大家进行编码实现这两点把握不准。     理想情况下讨论班应该只是成为一个“引子”,通过大家一起...

2017-05-04 22:44:32

阅读数:551

评论数:0

TensorFlow Seq2Seq Model笔记

1. tf.app.run()的疑惑     http://stackoverflow.com/questions/33703624/how-does-tf-app-run-work     tf.app类似python中argparse 2.

2017-03-27 15:11:59

阅读数:10782

评论数:0

TensorFlow1.0 运行报错 AttributeError: type object 'NewBase' has no attribute 'is_abstract'

安装TF后,import tensorflow报错: I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/str...

2017-03-26 23:39:35

阅读数:2699

评论数:0

爱丁堡大学神经机器翻译系统 nematus 使用笔记

代码准备: nematus https://github.com/rsennrich/nematus subword-nmt  https://github.com/rsennrich/subword-nmt

2017-03-22 16:48:03

阅读数:2606

评论数:1

强化学习 Reinforcement Learning 资料

1. 《机器学习》周志华著   第16章 2. https://www.analyticsvidhya.com/blog/2017/01/introduction-to-reinforcement-learning-implementation/ 3. https://www.nervanasys...

2017-03-22 00:10:00

阅读数:1004

评论数:0

组内菜鸟学习班

今天中午和褚师姐孙老师聊天,聊到了专业基础问题。大家都有同感,专业基础太差了。       11年至今,先后呆过四个组(硕士期间,计算所实习期间,博士期间和诺亚实习期间)。纵览各方豪杰,深感自己基础还是稍显薄弱。基础知识包括:机器学习/数学,专业知识,编程能力和英语读写。对于研究生做科研,自己的感...

2017-03-09 21:44:30

阅读数:888

评论数:0

谷歌 Dynamic Computation Graphs 动态计算图

上次调研Syntax+NMT(http://blog.csdn.net/wangxinginnlp/article/details/56488921)发现Sequence-to-Tree 或者 Tree-To-Sequence目前已经火热起来,但是目前绝大部分的深度学习框架(http://blog...

2017-03-02 23:47:26

阅读数:1194

评论数:0

资料收集:深度学习框架比较

1. https://en.wikipedia.org/wiki/Comparison_of_deep_learning_software 2. https://deeplearning4j.org/compare-dl4j-torch7-pylearn 3. https://www.mi...

2017-02-28 21:44:54

阅读数:821

评论数:0

多语言神经机器翻译

1.  Multiple Language Neural Machine Translation 1.1 Multi-Task Learning for Multiple Language Translation (ACL 2015) http://www.aclweb.org/anthology...

2017-02-22 20:19:13

阅读数:975

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭