随着AlphaGO的席卷,越来越多的学者意识到强化学习在人工智能领域的重要作用。与此同时,随着深度学习的发展和深度学习的应用,许多传统的伪原创工具自然语言问题被打破。另外,引用David Silver的话:深度学习(DL)+强化学习(RL)=人工智能(AI)。
1.文本挖掘任务类型的划分
文本挖掘任务分为四大类:类别到序列、序列到类别、同步(为每个输入位置生成输出)序列到序列、异步序列到序列。
同步序列到序列的示例包括中文分词,命名实体识别和词性标注。序列到序列包括机器翻译和自动摘要。序列到类别的示例包括文本分类和情感分析。序列的类别(对象)的示例包括文本生成和图像描述。
2.文本挖掘系统总体规划
大观数据一直专注于文本语义。文本挖掘系统的总体方案包括NLP处理的所有方面。它可以分为章级应用程序、短串应用程序和词汇应用程序。
章级应用有六个方面,有成熟的产品支持企业在不同方面的文本挖掘需求:
垃圾评论:准确识别广告、不文明的术语和低质量的文字。
黄色反识别:准确定位黄色和x017