特征处理
特征处理
蔚蓝祥和的天空
这个作者很懒,什么都没留下…
展开
-
VotingClassifier用法
"""一、Hard Voting 与 Soft Voting 的对比1)使用方式voting = 'hard':表示最终决策方式为 Hard Voting Classifier;voting = 'soft':表示最终决策方式为 Soft Voting Classifier; 2)思想Hard Voting Classifier:根据少数服从多数来定最终结果;Soft Voting Classifier:将所有模型预测样本为某一类别的概率的平均值作为标准,概率最高的对应的类型为最终的预测结原创 2020-10-09 20:08:31 · 5502 阅读 · 0 评论 -
KFold,StratifiedKFold,cross_val_score用法
一 、KFold和StratifiedKFoldKFold:KFold交叉采样:将训练/测试数据集划分n_splits个互斥子集,每次只用其中一个子集当做测试集,剩下的(n_splits-1)作为训练集,进行n_splits次实验并得到n_splits个结果。注:对于不能均等分的数据集,前n_samples%n_spllits子集拥有n_samples//n_spllits+1个样本,其余子集都只有n_samples//n_spllits个样本。(例10行数据分3份,只有一份可分4行,其他均为3行原创 2020-10-09 19:49:25 · 1762 阅读 · 3 评论 -
特征处理--First_Chapter
数据处理一、数据抽取1.CountVectorizer返回词频矩阵英文分词from sklearn.feature_extraction import DictVectorizerfrom sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizerfrom sklearn.preprocessing import MinMaxScaler, StandardScaler, Imputerfrom sklearn原创 2020-09-28 20:22:02 · 157 阅读 · 0 评论