文本分词、停用词过滤和对意义宽泛的高频术语词剔除后,依据词性和TF-IDF算法对文本词汇进行过滤,提取对表征文本内容作用较大的名词动词和形容词,并将文本集词权重小于0.1的词进行剔除,实现对专利文本近一卒的特征词选择
2123
最新推荐文章于 2021-01-11 13:45:53 发布
文本分词、停用词过滤和对意义宽泛的高频术语词剔除后,依据词性和TF-IDF算法对文本词汇进行过滤,提取对表征文本内容作用较大的名词动词和形容词,并将文本集词权重小于0.1的词进行剔除,实现对专利文本近一卒的特征词选择