lb_rainbow-CSDN博客

转载 task02 :attention及Transformer

attentionseq2seq一个序列到序列（seq2seq）模型，接收的输入是一个（单词、字母、图像特征）序列，输出是另外一个序列.seq2seq模型是由编码器（Encoder）和解码器（Decoder）组成的。其中，编码器会处理输入序列中的每个元素，把这些信息转换为一个向量（称为上下文（context））。当我们处理完整个输入序列后，编码器把上下文（context）发送给解码器，解码器开始逐项生成输出序列中的元素。attetion注意力模型的整个过程：注意力模型的解码器

2021-08-18 19:49:16 155

转载智慧海洋task2

数据分析的目的:EDA的主要价值在于熟悉整个数据集的基本情况(缺失值、异常值)，来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。了解特征之间的相关性、分布，以及特征与预测值之间的关系。为进行特征工程提供理论依据。#coding:utf-8#导入warnings包，利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import numpy as npimport pandas as pd

2021-04-16 22:16:09 96

原创二手车交易价格预测task2

## 基础工具import numpy as npimport pandas as pdimport warningsimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.special import jnfrom IPython.display import display, clear_outputimport timeimport csvwarnings.filterwarn

2021-04-16 21:53:51 187

原创智慧海洋task1

地理数据分析常用工具shapelyPointLineStringsLineRingsPolygongeopandasFoliumKepler.glGeoHashshapelyshapely是python中开源的空间几何对象库，支持Point(点)，LineString(线)， Polygon(面)等几何对象及相关空间操作。特性几何对象可以和numpy.array互相转换。可以轻松求线的长度(length)，面的面积（area)，对象之间的距离(dista

2021-04-15 00:04:47 167 1

转载二手车交易价格预测task1

赛题概况赛题以预测二手车的交易价格为任务，数据集报名后可见并可下载，该数据来自某交易平台的二手车交易记录，总数据量超过40w，包含31列变量信息，其中15列为匿名变量。为了保证比赛的公平性，将会从中抽取15万条作为训练集，5万条作为测试集A，5万条作为测试集B，同时会对name、model、brand和regionCode等信息进行脱敏。本赛题的评价标准为MAE(Mean Absolute Error)????*MAE=∑i=1n∣yi−y^i∣nMAE=\frac{\sum_{i=1}^{n}\l

2021-04-11 20:16:15 290

原创 task5心跳分类预测模型融合

模型融合的方式1.简单加权融合2.stacking/blending3.boosting/baggingstacking原理stacking是一种分层模型集成框架。以两层为例，第一层由多个基学习器组成，其输入为原始训练集，第二层的模型则是以第一层基学习器的输出作为训练集进行再训练，从而得到完整的stacking模型, stacking两层模型都使用了全部的训练数据。blending原理Blending与Stacking大致相同，只是Blending的主要区别在于训练集不是通过K-

2021-03-28 22:25:42 298

原创 task4心跳信号分类模型

心跳分类预测模型逻辑回归通过联系函数将线性回归z变化为g(z),并使g(z)的值分布在(0,1)之间这个联系函数为Sigmoid函数g(z) = 1 / (1+e-z)ln y(x) / (1-y(x))将 y(x) 和 1-y(x) 看作一对正反例发生的概率y(x) 表示某样本的标签被预测为1的概率1-y(x) 表示某样本的标签被预测为0的概率y(x)/ (1-y(x)) 是样本的标签被预测为1的相对概率使用最大似然法和概率分布函数推出逻辑回归的损失函数逻辑回归优点1.逻辑回归

2021-03-25 22:28:30 218

转载 task3心跳信号预测特征工程

特征工程导入包并读取数据# 包导入import pandas as pdimport numpy as npimport tsfresh as tsffrom tsfresh import extract_features, select_featuresfrom tsfresh.utilities.dataframe_functions import impute# 数据读取data_train = pd.read_csv("train.csv")data_test_A = pd.r

2021-03-22 20:11:49 96

原创 task2心跳信号预测数据分析

心跳信号分类数据分析载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy；可视化库 matplotlib、seabon；载入数据：载入训练集和测试集；简略观察数据(head()+shape)；数据总览:通过describe()来熟悉数据的相关统计量通过info()来熟悉数据类型判断数据缺失和异常查看每列的存在nan情况异常值检测了解预测值的分布总体分布概况查看skewness and kurtosis查看预测值的具体频数

2021-03-19 13:26:15 136

原创 task1心跳信号分类预测

Task1赛题理解Tip:本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第五场 —— 零基础入门心电图心跳信号多分类预测挑战赛。2016年6月，国务院办公厅印发《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,文件指出健康医疗大数据应用发展将带来健康医疗模式的深刻变化，有利于提升健康医疗服务效率和质量。赛题以心电图数据为背景，要求选手根据心电图感应数据预测心跳信号，其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例，这是一个多分类的问题。通过这道赛题来引导大

2021-03-16 22:00:57 129

lb_rainbow的博客

转载 task02 :attention及Transformer

转载智慧海洋task2

原创二手车交易价格预测task2

原创智慧海洋task1

转载二手车交易价格预测task1

原创 task5心跳分类预测模型融合

原创 task4心跳信号分类模型

转载 task3心跳信号预测特征工程

原创 task2心跳信号预测数据分析

原创 task1心跳信号分类预测

转载 Task 作者信息关联

转载 task 论文代码统计

转载 task论文作者统计

原创 task1论文数据统计

原创 2020-11-28

原创 Datawhale-numpy随机抽样

原创 Datawhale-numpy下输入与输出

空空如也

空空如也