数据挖掘
文章平均质量分 79
小赵要加油
这个作者很懒,什么都没留下…
展开
-
【数据挖掘】心电图--建模与调参task04
目录目标一、逻辑回归1.1概念1.2回归于分类的区别1.3原理二、决策树模型2.1概念2.2决策树模型的优缺点三、集成模型集成方法四、模型评估方法五、代码示例目标学习在金融分控领域常用的机器学习模型学习机器学习模型的建模过程与调参过程一、逻辑回归优点训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;适合二分类问题,不需要缩放输入特征;内存资源占用小,只需要存储各个维度的特征值;原创 2021-03-25 22:21:07 · 241 阅读 · 0 评论 -
【数据挖掘】心电图---task3
目录Task3特征工程3.1学习目标3.2 内容介绍3.3代码示例3.3.1导包并读取数据3.3.2数据预处理3.3.3 使用 tsfresh 进行时间序列特征处理1. 特征抽取2. 特征选择Task3特征工程3.1学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用3.2 内容介绍数据预处理时间序列数据格式处理加入时间步特征time特征工程时间序列特征构造特征筛选使用 tsfresh 进行时间序列特原创 2021-03-22 20:53:26 · 278 阅读 · 0 评论 -
【数据挖掘】心电图--Task02
内容介绍1.载入各种数据科学以及可视化库:数据科学库pandas、numpy、scipy;可视化库matplotlib、seabon;2.载入数据:载入训练集和测试集简略观察数据(head()+shape);3.数据总览:通过describe()来熟悉数据的相关统计量通过info()来熟悉数据类型4.判断数据缺失和异常查看mei’lie 的存在空情况异常值检测5.了解预测值的分布总体分布概况查看skewness and kurtosis查看预测值的具体频数...原创 2021-03-19 20:00:08 · 248 阅读 · 0 评论 -
数据挖掘---心电图task01
目录赛题理解赛题状况数据理解赛题分析baseline学习导入第三方包数据读取数据预处理训练数据/测试数据准备模型训练预测结果结果提交参考赛题理解赛题状况比赛要求参赛选手根据给定的数据集,建立模型,预测不同的心跳信号。赛题以预测心电图心跳信号类别为任务,数据集报名后可见并可下载,该该数据来自某平台心电图数据记录,总数据量超过20万,主要为1列心跳信号序列数据,其中每个样本的信号序列采样频次一致,长度相等。为了保证比赛的公平性,将会从中抽取10万条作为训练集,2万条作为测试集A,2万条作为测试集B,同时会翻译 2021-03-16 21:54:12 · 240 阅读 · 0 评论 -
【task02】共享单车数据挖掘赛
目录赛题要点早高峰共享单车潮汐点优化数据读取与理解共享单车轨迹数据赛题要点早高峰共享单车潮汐点优化赛题任务:识别出工作日高峰07:00-09:00潮汐现象最突出的40个区域,针对Top40区域计算结果进一步设计高峰期共享单车潮汐点优化方案;赛题数据:共享单车轨迹数据、共享单车停车点位(电子围栏)数据 和 共享单车订单数据;数据读取与理解共享单车轨迹数据共享单车轨迹数据为共享单车在使用时候产生的位置定位数据,具体包含单车在不同时间段(默认是15秒记录一次)下的经纬度信息。读取数原创 2021-02-24 20:10:14 · 3198 阅读 · 6 评论 -
【数据挖掘赛】task01
目录遇到的问题提交结果截图遇到的问题使用folium包进行电子围栏可视化操作时,需注意数据格式,转换为列表才能marker在地图上。程序运行中的错误需仔细查看报错内容。提交结果截图原创 2021-02-19 17:30:55 · 92 阅读 · 0 评论