意图分析及斯坦福NLP服务搭建

最新推荐文章于 2024-08-18 20:25:35 发布

花咪

最新推荐文章于 2024-08-18 20:25:35 发布

阅读量605

点赞数

分类专栏：机器学习自然语言处理

本文链接：https://blog.csdn.net/cyinfi/article/details/90743620

版权

机器学习同时被 2 个专栏收录

31 篇文章 2 订阅

订阅专栏

自然语言处理

29 篇文章 2 订阅

订阅专栏

标题

应用范围和场景
在自然语言处理的应用中，经常会用到分词，词性分析、句法分析、英体识别等应用，斯坦福NLP在中文支持方面还算不错，方便我们更快的支持和验证应用的可行性。
环境配值和搭建过程
下载 stanford-corenlp-full-2017-06-09.zip ，然后在系统中解压，下载该包支持的中文模型 stanford-chinese-corenlp-2017-06-09-models.jar ，注意名称需要对应，不然容易出bug。将模型的解压文件放到第一文包的解压文件中，如下图：

新建启动脚本如上图：注意指定中文的模型文件就可以了。
启动效果
语言支持
在这里开个头，共朋友们参考使用。

class service_ana(object):
    """
    对斯坦福服务的包装a
    """
    def __init__(self):
        pass
        #需要提前启动服务
        self.nlp = StanfordCoreNLP('http://localhost:9000')


    def get_res(self, text):
        """参数是多个句子的列表（分词和不分词都行）， 返回各个句子的分析结果"""
        output = self.nlp.annotate(text, properties={
            'annotators': 'tokenize,ssplit,pos,ner,depparse,parse',
            'outputFormat': 'json'
        })

        print(output['sentences'][0]['parse'])
        print(output['sentences'][0]['basicDependencies'])
        print(output['sentences'][0]['enhancedDependencies'])
        print(output['sentences'][0]['enhancedPlusPlusDependencies'])
        print(output['sentences'][0]['tokens'])