自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Task 5: 模型融合

Task 5: 模型融合简单加权平均Stacking融合(回归)分类模型融合Voting投票机制分类的Stacking\Blending融合: 简单加权平均 import numpy as np import pandas as pd from sklearn import metrics ## 生成一些简单的样本数据,test_prei 代表第i个模型的预测值 test_pre1 = [1.2, 3.2, 2.1, 6.2] test_pre2 = [0.9, 3.1, 2.0, 5.9] test_p

2021-03-28 18:46:40 77

原创 Task4 建模与调参

Task4 建模与调参逻辑回归模型:决策树模型集成模型集成方法(ensemble method)Bagging和Boosting的区别总结如下:样本选择上:样例权重上:预测函数上:并行计算上:模型评估方法代码简单建模预操作模型调参贝叶斯调参 逻辑回归模型: 优点:训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;适合二分类问题,不需要缩放输入特征;内存资源占用小,只需要存储各个维度的特征值; 缺点:不能用Logistic

2021-03-25 19:49:58 65

原创 Task3 特征工程

Task3 特征工程时间序列数据的特征预处理方法数据预处理时间序列数据格式处理对心电特征进行行转列处理,同时为每个心电信号加入时间步特征time将处理后的心电特征加入到训练数据中,同时将训练数据label列单独存储特征工程时间序列特征构造加入时间步特征time特征提取特征筛选使用 tsfresh 进行时间序列特征处理 时间序列数据的特征预处理方法 数据预处理 # 包导入 import pandas as pd import numpy as np import tsfresh as tsf from tsf

2021-03-22 20:10:33 71

原创 2021-03-19

Task2 数据分析各种数据科学以及可视化库:载入数据:数据总览:判断数据缺失和异常了解预测值的分布用pandas_profiling生成数据报告 各种数据科学以及可视化库: 数据科学库 pandas、numpy、scipy; 可视化库 matplotlib、seabon; #coding:utf-8 #导入warnings包,利用过滤器来实现忽略警告语句。 import warnings warnings.filterwarnings('ignore') import missingno as msno

2021-03-19 18:41:56 130 1

转载 零基础入门心电图心跳信号多分类预测挑战赛赛题理解

目录背景介绍预测指标计算公式多分类算法常见的评估指标 List item 背景介绍 赛题以心电图数据为背景,根据心电图感应数据预测心跳信号,其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例,是一个多分类的问题。比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction train.csv id 为心跳信号分配的唯一标识 heartbeat_signals 心跳信号序列(数据之间采用“,”进行分隔) lab

2021-03-16 18:08:21 205

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除