![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
入门数据挖掘
文章平均质量分 81
coder帅
种一棵树最好的时间是十年前,其次是现在。
展开
-
入门数据挖掘-心电图信号预测datawhale组队学习笔记-task5 模型融合
心电图信号预测 - task 5 模型融合1. 融合方法1.1 简单加权融合1.2 stacking/blending[^1]1.2.1 stacking1.2.2 blending1.3 boosting/bagging2. 代码示例2.1 回归(分类概率)融合2.2 Stacking融合(回归)2.3 分类模型融合2.3.1 Voting投票机制2.3.2 分类的Stacking/Blending融合1. 融合方法1.1 简单加权融合回归(分类概率):算术平均,几何平均融合分类: 投票(Vot原创 2021-03-28 06:51:24 · 189 阅读 · 0 评论 -
入门数据挖掘-心电图信号预测datawhale组队学习笔记-task4 建模与调参
心电图信号预测 - task 4 建模与调参1. 学习模型1.1 逻辑回归模型1.2 决策树模型1.3 集成模型(ensemble method)1.3.1 bagging 和 boosting2 模型评估方法2.1 数据集划分2.2 划分方法2.3 总结2.4 评价标准3. 代码示例3.1 导入工具包,读取数据3.2 简单建模1. 学习模型1.1 逻辑回归模型优点:可解释性好,适合二分类问题,训练速度快,计算量仅与特征数目有关。缺点:需要预先处理异常值和缺失值;对多重共线性数据较为敏感,很难处理原创 2021-03-26 01:19:49 · 317 阅读 · 0 评论 -
入门数据挖掘-心电图信号预测datawhale组队学习笔记-task3
入门数据挖掘-心电图信号预测-Task3 特征工程1. 数据预处理2. 使用tsfresh进行时间序列特征处理2.1 Tsfresh2.2 去除NaN值2.3 计算特征与响应变量的相关性并选择特征[1] 本文参考datawhale组队学习Task3 特征工程1. 数据预处理对心电特征进行行转列处理,同时为每个心电信号加入时间步特征timetrain_heartbeat_df = data_train["heartbeat_signals"].str.split(",", expand=Tr原创 2021-03-23 02:36:02 · 268 阅读 · 0 评论 -
入门数据挖掘-心电图信号预测datawhale组队学习笔记-task 1
心电图信号多分类预测挑战赛-Task1 baseline学习笔记1.赛题概况1.1 数据概况1.2 预测指标1.3 多分类算法常见评估指标1.3.1 Confuse Matrix:1.4 赛题分析2. baseline3. 提交成绩[1] 本文参考datawhale3月组队学习.team-learning-data-mining/HeartbeatClassification1.赛题概况比赛地址:天池心跳信号分类预测比赛要求选手根据给定的数据集,建立模型,预测不同的心跳信号。赛题以预测心电图心跳原创 2021-03-16 19:08:57 · 316 阅读 · 2 评论