机器学习模板

最新推荐文章于 2024-05-27 17:38:32 发布

csid_502

最新推荐文章于 2024-05-27 17:38:32 发布

阅读量196

点赞数

文章标签： python 人工智能

根据心情补充，语言都是Python

hash，把所有的文本转化成数字

from sklearn.preprocessing import LabelEncoder
for c in train.columns:
    if train[c].dtype == 'object':
        lbl = LabelEncoder()
        lbl.fit(list(train[c].values) + list(test[c].values))
        train[c] = lbl.transform(list(train[c].values))
        test[c] = lbl.transform(list(test[c].values))

Xgboost训练

'''Train the xgb model then predict the test data'''

xgb_params = {
    'n_trees': 520, 
    'eta': 0.0045,
    'max_depth': 4,
    'subsample': 0.93,
    'objective': 'reg:linear', 
    'eval_metric': 'rmse',
    'base_score': y_mean, # base prediction = mean(target)
    'silent': 1
}
# NOTE: Make sure that the class is labeled 'class' in the data file

dtrain = xgb.DMatrix(train.drop('y', axis=1), y_train)
dtest = xgb.DMatrix(test)

num_boost_rounds = 1250
# train model
model = xgb.train(dict(xgb_params, silent=0), dtrain, num_boost_round=num_boost_rounds)
y_pred = model.predict(dtest)

OneHot矩阵转换

enc = OneHotEncoder(handle_unknown='ignore')
enc=enc.fit(pd.concat([X[categorical],X_test[categorical]]))
X_cat_sparse=enc.transform(X[categorical])
X_test_cat_sparse=enc.transform(X_test[categorical])

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

csid_502

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习模板

根据心情补充，语言都是Pythonhash，把所有的文本转化成数字from sklearn.preprocessing import LabelEncoderfor c in train.columns: if train[c].dtype == 'object': lbl = LabelEncoder() lbl.fit(list(train[c]....
复制链接

扫一扫