项目简介
人工智能技术研究中,人机交互系统是服务机器人、虚拟人等终端设备的关键系统,它需要对用户输入的问题进行解析理解,然后匹配到知识库中的某个答案,整个交互过程是否流畅、回答是否准确直接影响到用户的体验。而基于关键词的语义泛化系统就是用户问题解析理解的一种技术,十分重要。
在这个系统中,主要包括提取关键词、关键词语义泛化、语义泛化过程服务化三个部分。通过这个系统,可以大大较小人工进行泛化的工作,提高效率。
项目分组与分工
我分为了关键词提取小组,具体分工是每个人对关键词提取写一个算法最后比较择优选取作为小组的成果
前期准备
使用语言为python,编译器使用pycharm
算法的选取,对关键词算法的初步学习
算法的选取
经过分析决定使用无监督学习的算法,考虑算法TF/IDF,TestRank,LDA。
最后经过考虑,选择使用基于主题的关键词提取算法,即LDA算法