公众号 系统之神与我同在
【导读】自然语言生成在聊天机器人,故事生成和数据描述中具有广泛的应用领域。 涉及自然语言生成过程的技术种类繁多。 本文提供了提供自然语言生成应用程序和技术的各种项目,工具,论文和学习资料的链接。内容包括数据集、对话系统、评估、语法、论文、视频等。
原文链接:
https://github.com/tokenmill/awesome-nlg
数据集
- E2E:一个聚焦于端到端数据驱动的自然语言生成方法的数据集。
- Neural-Wikipedian :这个数据集包括了
- WebNLG:在INLG2018 的论文"Enriching the WebNLG corpus" 中被提到
- Yelp:餐馆评价的自然语言资源提供
对话系统
- Chatio:使用DSL生成用于AIChatBot,自然语言Task、命名实体识别或者文本分类的数据集
- RNNLG:自然语言生成应用领域的开源Benchmark
- NNDIAL:构建端到端可训练任务驱动的对话系统模型
评估
- NLG-Eval:自然语言生成任务评估代码
- VizSeq:文本生成任务可视化工具
故事生成
- Random Story Generator:使用自然语言生成技术,生成随机故事
- Tracery:一个JavaScript的故事生成器
神经网络自然语言生成
- Graph2Text
- Image Caption Generator:使用TensorFlow实现,
- PPLM:Plug and Play 语言生成模型
- textgenrnn:可利用少量代码快速训练任何大小与复杂度的文本生成神经网络
- Transformers:Tensorflow2.0与Pytorch实现的最佳自然语言处理模型
- Summary Generation From Structured Data :利用结构化数据集生成自然语言
论文
- A Closer Look at Recent Results of Verb Selection for Data-to-Text NLG
- A Personalized Data-to-Text Support Tool for Cancer Patients
- Controlling Contents in Data-to-Document Generation withHuman-Designed Topic Labels
- Hotel Scribe: Generating High Variation Hotel Descriptions
- Natural Language Generation enhances human decision-making withuncertain information
- NLP - Text Generation Reading List
- Survey of the State of the Art in NaturalLanguage Generation: Core tasks, applicationsand evaluation
- Revisiting Challenges in Data-to-Text Generation with Fact Grounding
产品
- Accelerated Text :自动生成数据的多种结构与文本的描述
- Twine:一个讲交互式、非线性故事的开源工具
生产工具
- Genl: 使用Tree Adjoining Grammar的API接口
- JSrealB :一个用于Web开发的JavaScript 双语文本生成API
- SimpleNLG:一个自然语言生成的Java API
- SimpleNLG DE:SimpleNLG的德语版本
- SimpleNLG-EnFr:SimpleNLG的英语/法语版本
视频
- Data-To-Text: Generating Textual Summaries of Complex Data - Ehud Reiter
- Natural Language Generation (Introduction)
- Strata Data Conference | The future of natural language generation: 2017-2027
- The Quest for Automated Story Generation - Mark Riedl