word中文分词器使用

最新推荐文章于 2024-08-16 08:48:46 发布

weixin_34184561

最新推荐文章于 2024-08-16 08:48:46 发布

阅读量1k

点赞数

文章标签： python java 大数据

原文链接：https://my.oschina.net/hehongbo/blog/1545038

版权

2019独角兽企业重金招聘Python工程师标准>>>

一、pom.xml

<!-- 分词库 -->
        <dependency>
            <groupId>org.apdplat</groupId>
            <artifactId>word</artifactId>
            <version>1.2</version>
        </dependency>

二、使用api编程

package cn.hhb.spark.mllib

import org.apdplat.word.WordSegmenter

object WordToKenizer {
  def main(args: Array[String]) {
    var list = WordSegmenter.seg("南京市长江大桥")
    println(list)
  }
}

转载于:https://my.oschina.net/hehongbo/blog/1545038