达观杯 比赛简介 特征工程 1.构建特征 countvectororizerTfidfVectorizerDoc2VecHashingVectorizerlength降维lsa 和 ldaSelectFromModel 2.组合特征 tfidf(word+article)tfidf(word+article)+lsatfidf(word+article+length)linearsvm-tfidf(word)+lr-tfidf(article)countvector(w)+doc(w)+hash(w) 构建模型 linearSVM逻辑回归lightGBM贝叶斯 模型融合 概率融合分类融合