(第三周)文章一
背景
考虑对于文章类型进行判断等需求,需要进行关键词提取以方便检索。
依赖
考虑使用Jieba库,但由于是Java开发,目前java的jieba库没有人维护只有基础的功能,但还是在此放上
<dependency>
<groupId>com.huaban</groupId>
<artifactId>jieba-analysis</artifactId>
<version>1.0.2</version>
</dependency>
实现
由于java的jieba库没有python的jieba库好用,最后还是决定使用python的jieba库来实现
首先写下python的jieba库实现,之后再用java调用python
python实现:
import sys
import jieba.analyse
if __name__ == '__main__':
content = sys.argv[1]
#