![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
组队学习:数据挖掘
文章平均质量分 93
「已注销」
这个作者很懒,什么都没留下…
展开
-
组队学习第四天:心跳信号分类之建模与调参
原题目地址:零基础入门数据挖掘-心跳信号分类预测 本文是鸣鹤星空小组组队学习的集体成果。 id:李由,一只小呆 源地址:组队学习 1 学习目标 学习机器学习模型的建模过程与调参流程 完成相应学习打卡任务 2 内容介绍 逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模型 随机森林模型 基于boosting思想的集成模型 XGBoost模型 Ligh原创 2021-03-25 23:47:15 · 145 阅读 · 1 评论 -
组队学习第三天:心跳信号分类之特征工程
原题目地址:零基础入门数据挖掘-心跳信号分类预测 本文是鸣鹤星空小组组队学习的集体成果。 id:李由,一只小呆 源地址:组队学习 3.1 学习目标 学习时间序列数据的特征预处理方法 学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用 3.2 内容介绍 数据预处理 时间序列数据格式处理 加入时间步特征time 特征工程 时间序列特征构造 特征筛选 使用 tsfresh 进行时间序列特征处理 3.3 学习代码 # 包导入 import pandas as p原创 2021-03-22 22:02:04 · 118 阅读 · 0 评论 -
组队学习第二天:心跳信号分类之baseline学习
原题目地址:零基础入门数据挖掘-心跳信号分类预测 本文是鸣鹤星空小组组队学习的集体成果。 id:李由,一只小呆 1 EDA 目标 EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。 引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。 完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打原创 2021-03-19 21:49:07 · 256 阅读 · 0 评论 -
组队学习第一天:心跳信号分类之baseline学习
组队学习第一天:心跳信号分类之baseline学习 原题目地址:零基础入门数据挖掘-心跳信号分类预测 任务要求 理解赛题数据和目标,清楚评分体系。 完成赛题报名和数据下载,理解赛题的解题思路。 学习baseline方案,并成功运行提交结果。 题目描述 赛题背景 赛题以医疗数据挖掘为背景,要求选手使用提供的心跳信号传感器数据训练模型并完成不同心跳信号的分类的任务。为了更好的引导大家入门,还特别为本赛题定制了学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。 通过对本方案的完整学习,原创 2021-03-16 22:28:32 · 267 阅读 · 0 评论