文本聚类 java_【Java】文本聚类

最新推荐文章于 2021-02-24 13:50:12 发布

weixin_39973518

最新推荐文章于 2021-02-24 13:50:12 发布

阅读量506

点赞数

文章标签：文本聚类 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39973518/article/details/114346229

版权

【Java】文本聚类

前言：

由于接到一个任务，大概是对回复内容的质量进行评估(有点类似于情感分类)，由于这种分类，没有定性的指标，只能认为规定好——坏之间的几个梯度指标，但由于有些回复的内容过长，人工打标签的时候不方便，我就想着使用主题抽取模型抽取长文本转化为短文本，再利用文本聚类的方法，把相似的文本存放到一起

准备工作

由于需要处理表格数据，这里我用到了java的 poi 框架

安装：

由于我是使用mavan构建的项目，所以直接添加依赖就可以了

org.apache.poi

poi

3.11

org.apache.poi

poi-ooxml

3.11

org.apache.poi

poi-ooxml-schemas

3.11

文本聚类和主题抽取

我直接采用hanlp这个框架中的模型

项目流程

1578eda404fe

项目流程.png

具体实现

package com.NLP.test;

import com.hankcs.hanlp.HanLP;

import com.hankcs.hanlp.mining.cluster.ClusterAnalyzer;

import org.apache.poi.xssf.usermodel.XSSFCell;

import org.apache.poi.xss

最低0.47元/天解锁文章

weixin_39973518

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
文本聚类 java_【Java】文本聚类

【Java】文本聚类前言：由于接到一个任务，大概是对回复内容的质量进行评估(有点类似于情感分类)，由于这种分类，没有定性的指标，只能认为规定好——坏之间的几个梯度指标，但由于有些回复的内容过长，人工打标签的时候不方便，我就想着使用主题抽取模型抽取长文本转化为短文本，再利用文本聚类的方法，把相似的文本存放到一起准备工作由于需要处理表格数据，这里我用到了java的 poi 框架安装：由于我是...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。