datawhale
文章平均质量分 69
Lemon__sweet
这个作者很懒,什么都没留下…
展开
-
零基础入门数据挖掘-Task1 赛题理解
零基础入门数据挖掘-Task1 赛题理解首先对于自己的要求:不论结构如何,将流程完成。不需要完美程度,只需要完成度即可。严格意义的第一次比赛,上次走到这一步就结束了。1. 评估指标MAE:回归预测类常见的评估指标。平均绝对误差(Mean Absolute Error)。能更好地反映预测值与真实值误差的实际情况。2. 分析赛题回归问题传统的数据挖掘问题通过EDA来挖掘数据的联系和自我熟悉数据。3. 数据读取和指标评价的示例数据读取部分,已经有所了解。评价指标计算,需要再仔细看一下。原创 2021-04-13 22:45:22 · 86 阅读 · 0 评论 -
datawhale数据挖掘心电图Task2
Exploratory Data Analysis在弄清数据之前弄清楚手中的数据.探索性数据分析是指对数据进行初步调查,以发现模式,发现异常情况,检验假设并在汇总统计信息和图形表示的帮助下检查假设的关键过程。价值主要在于熟悉数据集,了解数据集,确定所获得数据集可以用于接下来的机器学习或者深度学习使用。了解变量间的相互关系以及变量与预测值之间的存在关系。各种数据科学以及可视化库数据科学库 pandas、numpy、scipy;可视化库 matplotlib、seabon;import原创 2021-03-17 17:23:19 · 306 阅读 · 0 评论 -
datawhale数据挖掘心电图Task1
理解赛题数据和目标,清楚评分体系。完成赛题报名和数据下载,理解赛题的解题思路。学习baseline方案,并成功运行提交结果。前期准备赛题理解的是数据竞赛的第一步,也是极其重要的一步。赛题的理解会影响后续的特征工程以及构建模型的思路。赛题背后的思想以及赛题的业务逻辑的理解也能很大程度的增加强特征的构建,从而构建更有效的模型。在开始比赛之前要对赛题进行充分的了解读懂赛题的背景,赛题数据的来源,赛题数据的概况,对于赛题数据有一个初步了解,知道现在和任务的相关数据有哪些,其中数据之间的关联逻.原创 2021-03-16 16:52:26 · 135 阅读 · 1 评论