心跳信号分类预测-特征工程——模型提优

本文探讨如何通过特征工程提升心跳信号分类模型的性能。内容包括使用tsfresh进行时间序列特征处理,特征筛选,以及应用相关性分析进行特征选择,最终保留了700个有效特征。
摘要由CSDN通过智能技术生成

特征工程

对模型进行提优

首先将预测的概率进行分类将概率大于0.8的设置为1,将概率小于0.2的设置为0:

for index,row in data.iterrows():
    row_max = max(list(row)[1:])
    if row_max>0.8:
        for i in range(1,5):
            if row[i]>0.8:
                data.iloc[index,i]=1
            else:
                data.iloc[index,i]=0

将得到的结果进行提交可以得到得分有了提升:
在这里插入图片描述

1 学习目标

  • 学习时间序列数据的特征预处理方法
  • 学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用

2 内容介绍

  • 数据预处理
    • 时间序列数据格式处理
    • 加入时间步特征time
  • 特征工程
    • 时间序列特征构造
    • 特征筛选
    • 使用 tsfresh 进行时间序列特征处理

3 代码示例

3.1 导入包并读取数据

# 包导入
import pandas as pd
import numpy as np
import tsfresh as tsf
from tsfresh import extract_features, select_features
from tsfresh.utilities.dataframe_functions import impute
# 数据读取
data_train = pd.read_csv("train.csv")
data_test_A = pd.read_csv("testA.csv")

print(data_train.shape)
print(data_test_A.shape)
(100000, 3)
(20000, 2)
data_train.head()
  	id		heartbeat_signals	                                label
0		0			0.9912297987616655,0.9435330436439665,0.7646770.0
1		1			0.9714822034884503,0.9289687459588268,0.5729320.0
2		2			1.0,0.9591487564065292,0.7013782792997189,0.232.0
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黎明之道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值