排序:
默认
按更新时间
按访问量
RSS订阅

文本分析--关键词获取(jieba分词器,TF-IDF模型)

文本分析--关键词获取(jieba分词器,TF-IDF模型)关键词获取可以通过两种方式来获取:       1、在使用jieba分词对文本进行处理之后,可以通过统计词频来获取关键词:jieba.analyse.extract_tags(news, topK=10),获取词频在前10的作为关键词。 ...

2018-06-06 21:49:58

阅读数 2137

评论数 0

labelencoding onehot

Label encoding在某些情况下很有用,但是场景限制很多。比如有一列 [dog,cat,dog,mouse,cat],我们把其转换为[1,2,1,3,2]。这里就产生了一个奇怪的现象:dog和mouse的平均值是cat。而且像decision tree,random forest和xgbo...

2018-03-26 19:52:46

阅读数 65

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭