Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1
使用语言:python
Tas1 – Task5
Task1
赛题理解:
根据给定的数据集,建立模型,预测不同的心跳信号(以预测心电图心跳信号类别)。
数据概况:
“train.csv”
“testA.csv”
预测指标:
提交4种不同心跳信号预测的概率,与实际心跳类型结果进行对比,求预测的概率与真实值差值的绝对值。
学习点:
LigthGBM是boosting集合模型中的新进成员,由微软提供,它和XGBoost一样是对GBDT的高效实现,原理上它和GBDT及XGBoost类似,都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。
参数设置:
Params = { 'boosting_type': 'gbdt', 'Objective': 'multiclass', 'num_class': 4, 'num_leaves': 2 ** 5, 'feature_fraction': 0.8, 'bagging_fraction': 0.8, 'bagging_freq': 4, 'learning_rate': 0.1, 'seed': seed, 'nthread': 28, 'n_jobs':24, 'verbose': -1, }
需要理解根据自己数据的不同特征,选择不同的模型以及调整合适的参数方法,注意过拟合、时间消耗过大等的问题。
友情链接:https://tianchi.aliyun.com/competition/
Datawhale组织