学习赛项目
文章平均质量分 88
学习赛
LKID体
欢迎交流学习,wx号:lkidti。或关注微信公众号LKIDTI
展开
-
心电图学习任务四——建模与调参
一、建模与调参在本节心电图预测中,是关于时间序列的学习,我们在之前了解数据模型之后,了解到这是一个关于回归问题的学习,我们要拟合出回归的效果回归模型我们一直是机器学习中很重到的一部分,所以我们要大概的了解回归模型:可以学习这一篇本篇学习地址在学习地址中能看到回归模型简单学习,而且对集成学习,调参都是有很好的说明的。在这里就不在讲述了,我只添加了一些代码注释。代码部分:#导入相关的库import pandas as pdimport numpy as npfrom sklearn.metr原创 2021-03-25 22:12:05 · 516 阅读 · 2 评论 -
心跳信号分类预测Task3 特征处理
一、特征处理本节继续上面一篇,特征工程,在数据竞赛中,特征处理往往是很重要的一部分,这也非常符合二八定律的,我们敲代码,调模型这些时间往往没有我们的特征处理时间更长的。在这里时间序列的特征处理我们要学习一下,工具 Tsfresh(TimeSeries Fresh)的使用tsfresh是开源的提取时序数据特征的python包,能够提取出超过4000种特征,堪称提取时序特征的瑞士军刀。数据预处理 时间序列数据格式处理 加入时间步特征time特征工程时间序列特征构造特征筛选使用原创 2021-03-22 22:05:42 · 381 阅读 · 3 评论 -
二、数据了解与分析
数据探索与分析一、导入必要的库import warningswarnings.filterwarnings('ignore')# import missingno as msnoimport pandas as pdfrom pandas import DataFrameimport matplotlib.pyplot as plt import seaborn as snsimport numpy as np二、读取训练与测试数据Train_data = pd.read_csv('原创 2021-03-19 21:24:20 · 194 阅读 · 0 评论 -
心跳信号分类预测Task1 赛题理解
Datawhale 零基础入门数据挖掘-Task1 赛题理解一、赛题理解Tip:本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第五场 —— 零基础入门心电图心跳信号多分类预测挑战赛。1.1、赛题概况比赛要求参赛选手根据给定的数据集,建立模型,预测不同的心跳信号。赛题以预测心电图心跳信号类别为任务,数据集报名后可见并可下载,该该数据来自某平台心电图数据记录,总数据量超过20万,主要为1列心跳信号序列数据,其中每个样本的信号序列采样频次一致,长度相等。为了保证比赛的公平性,将会从中抽取原创 2021-03-16 20:57:05 · 237 阅读 · 0 评论 -
零基础入门金融风控Task5 模型融合
零基础入门金融风控Task5 模型融合这一节是在上一节基础上进行的,请合起来一起看。1 学习目标将之前建模调参的结果进行模型融合。 尝试多种融合方案。2 内容介绍模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大幅提升,以下是模型融合的方式。平均:---------简单平均法---------加权平均法投票:---------简单投票法---------加权原创 2020-09-27 22:47:19 · 226 阅读 · 0 评论 -
零基础入门金融风控之贷款违约预测Task4:建模和调参
零基础入门金融风控之贷款违约预测Task4:建模和调参4.1 学习目标学习在金融分控领域常用的机器学习模型学习机器学习模型的建模过程与调参流程4.2 理论基础1.逻辑回归sigmoid函数:sigmoid是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别)sigmoid函数的特点:[-5,5]之间快速变化由-1到1,;奇函数;当x≥0 时,y≥0.5,分类为1,当 x<0时,y<0.5,分类为0代价函数:适合于逻辑回归的代价函数是对hx取负对数梯度下降原创 2020-09-24 23:35:41 · 584 阅读 · 0 评论 -
零基础入门金融风控之贷款违约预测Task3:特征工程
零基础入门金融风控之贷款违约预测Task3:特征工程特征工程是数据处理中最为重要的一部分,也是变化最多一部分。如果把特征工程给处理好,那么就等于成功一半。数据处理预准备import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tqdmfrom sklearn.preprocessing import Lab原创 2020-09-21 22:26:01 · 240 阅读 · 3 评论 -
零基础入门金融风控之贷款违约预测的Task2:数据分析
零基础入门金融风控之贷款违约预测Task2:数据分析这里写目录标题零基础入门金融风控之贷款违约预测Task2:数据分析2.1 学习目标2.2 分析内容2.3 分析过程注意2.1 学习目标1、学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值)2、学习了解变量间的相互关系、变量与预测值之间的存在关系完成相应学习打卡任务2.2 分析内容1、数据总体的了解一般查看数据的纬度,数据类型,基本了解一下数据各个统计量说的啥,对此有一个大概的了解2、查看数据缺失和唯一值3、深入原创 2020-09-18 22:22:51 · 269 阅读 · 0 评论 -
零基础入门金融风控之贷款违约预测的Task1:赛题理解
零基础入门金融风控之贷款违约预测Task1:赛题理解这一部分只是对赛题简单说明一下,没啥意义。1.赛题概况赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。2.数据概况一般而言,对于数据在比赛界面都有对应原创 2020-09-15 19:05:15 · 187 阅读 · 3 评论