sklearn
Z-Pilgrim
这个作者很懒,什么都没留下…
展开
-
sklearn 计算tf-idf
官方文档太长了,貌似没有单独的Example两种写法:简洁的:from sklearn.feature_extraction.text import TfidfVectorizerdef cal_tf_idf_sparse(train_corpus, test_corpus): tfidf_vec = TfidfVectorizer() print "fit原创 2017-04-11 00:27:28 · 3133 阅读 · 0 评论 -
sklearn 样本均衡 class_weight='balanced'的实现方法
想了解这个的原因,是因为Gbdt不能设置这个参数,但是GBDT是最常用的分类器了...查了一会儿还想了下原理,想知道原理上为啥gbdt不能设置class_weight... 然后发现虽然sklearn没有这个选项,但是LightGBM是有的啊...所以应该是可以实现,但是Sklearn只是没有实现而已。。。scale_pos_weight, default=1.0, type=doub原创 2017-04-26 01:13:19 · 32039 阅读 · 0 评论