- 博客(14)
- 收藏
- 关注
原创 自然语言处理jieba
因为“给”和“力”在原词典中词频特别高,所以要识别的时候“给力”不被拆分成两个字,就得把词频的值设得更高.2.搜索引擎模式返回:如果要用搜索引擎模式,在前面的方法里加上。安装),可以获取文本中的词汇信息。当想要使用自定义词典时,可以通过。1.精确模式返回:通过使用。
2023-07-07 07:59:20 162 1
原创 Tfidf中的TfidfVectorizer, TfidfTransformer, CountVectorizer区别
TfidfVectorizer,TfidfTransformer,CountVectorizer区别
2023-04-26 10:31:18 213
原创 hive分区排序row_number、rank和dense_rank,列转行collect_list和collect_set
hive分区排序row_number、rank和dense_rank,collect_list和collect_set的区别
2022-12-19 15:28:42 549
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人