目录
- 1.分词 Word Segmentation
- 2.词预测 Word Prediction
- 3. 文本蕴涵 Textual Entailment
- 4. 语音识别 Automatic Speech Recognition
- 5. 自动摘要 Automatic Summarisation
- 6. 文本纠错 Text Correct
- 7.字音转换 Grapheme to Phoneme
- 8. 复述检测 Paraphrase Detection 和 问答 Question Answering
- 9. 音汉互译 Pinyin-To-Chinese
- 10. 情感分析 Sentiment Analysis
- 11. 手语识别 Sign Language Recognition
- 12. 词性标注(POS)、 命名实体识别(NER)、 句法分析(parser)、 语义角色标注(SRL) 等。
- 13. 词干 Word Stemming
- 14. 语言识别 Language Identification
- 15. 机器翻译 Machine Translation
- 16. 复述生成 Paraphrase Generation
- 17. 关系抽取 Relationship Extraction
- 18. 句子边界消歧 Sentence Boundary Disambiguation
- 19.事件抽取 Event Extraction
- 20. 词义消歧 Word Sense Disambiguation
- 21. 命名实体消歧 Named Entity Disambiguation
- 22. 幽默检测 Humor Detection
- 23. 讽刺检测 Sarcasm Detection
- 24. 实体链接 Entity Linking
- 25. 指代消歧 Coreference Resolution
- 26. 关键词/短语抽取和社会标签推荐 Keyphrase Extraction and Social Tag Suggestion
1.分词 Word Segmentation
chqiwang/convseg ,基于CNN做中文分词,提供数据和代码。(python2.7 )
对应的论文Convolutional Neural Network with Word Embeddings for Chinese Word Segmentation IJCNLP2017.
2.词预测 Word Prediction
Kyubyong/word_prediction ,基于CNN做词预测,提供数据和代码。代码的准确对比的是Iphone7的键盘输入,最新跟新是2019年7月。
3. 文本蕴涵 Textual Entailment
Steven-Hewitt/Entailment-with-Tensorflow,基于Tensorflow做文本蕴涵,提供数据和代码。 "Textual entailment with TensorFlow: Using neural networks to explore natural language,"的作者开发,但是代码很久没更新了,文章发表于2017年。
4. 语音识别 Automatic Speech Recognition
buriburisuri/speech-to-text-wavenet,基于DeepMind WaveNet和Tensorflow 1.0做句子级语音识别。17年的代码
5. 自动摘要 Automatic Summarisation
PKULCWM/PKUSUMSUM,北大万小军老师团队的自动摘要方法汇总,包含了他们大量paper的实现,支持单文档摘要、多文档摘要、topic-focused多文档摘要。
6. 文本纠错 Text Correct
atpaino/deep-text-corrector,基于深度学习做文本纠错,提供数据和代码。
7.字音转换 Grapheme to Phoneme
cmusphinx/g2p-seq2seq,基于网红transformer做, 提供数据和代码。