![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
nlp
wakawakaohoh
这个作者很懒,什么都没留下…
展开
-
解决语义重复,语义包含关系
生成的文本会出现语义包含现象,现在有过滤掉出现语义包含的语句import com.hankcs.hanlp.seg.common.Term;import com.hankcs.hanlp.tokenizer.StandardTokenizer;import java.util.ArrayList;import java.util.List;/** * created by liangpengfei on 2020/10/15 */public class FilterInclusion原创 2020-10-15 17:30:45 · 1013 阅读 · 0 评论 -
利用hanlp比较文本相似度
import com.hankcs.hanlp.seg.common.Term;import com.hankcs.hanlp.tokenizer.StandardTokenizer;import org.apache.commons.lang3.StringUtils;import org.jsoup.Jsoup;import org.jsoup.safety.Whitelist;import java.math.BigInteger;import java.util.ArrayList;原创 2020-10-15 17:28:15 · 2584 阅读 · 1 评论