自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 datawhale OCR task1

环境配置paddlepaddle其他环境python3GPU步骤1:下载比赛图片python3 down_image.py保存目录为train_data/tianchi/image,按照文件名进行保存,训练集和测试集存储在一起。步骤2:下载预测模型由于OCR包括多个步骤,此时我们只对其中检测的部署进行fientune,所以其他部署的权重也需要下载。mkdir inference && cd inference/# 下载模型wget https://paddle

2021-07-14 20:20:53 58

原创 Task5 模型融合

回归\分类概率-融合:简单加权平均,结果直接融合## 生成一些简单的样本数据,test_prei 代表第i个模型的预测值test_pre1 = [1.2, 3.2, 2.1, 6.2]test_pre2 = [0.9, 3.1, 2.0, 5.9]test_pre3 = [1.1, 2.9, 2.2, 6.0]# y_test_true 代表第模型的真实值y_test_true = [1, 3, 2, 6] import numpy as npimport pandas as pd

2021-04-24 17:04:09 102

原创 Task4 建模调参

读取数据import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')#reduce_mem_usage 函数通过调整数据类型,减少数据在内存中占用的空间def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type to r

2021-04-22 17:13:54 164

原创 Task3 特征工程

特征工程导入数据import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snsfrom operator import itemgetter%matplotlib inlinetrain = pd.read_csv('train.csv', sep=' ')test = pd.read_csv('testA.csv', sep=' ')

2021-04-19 14:29:53 115

原创 Task2 数据分析

数据探索性分析#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport missingno as msno载入数据## 1) 载入训练集和测试集;Train_data = pd.read_csv('t

2021-04-16 10:06:54 155

原创 Task1 赛题理解

二手车价格预测task1数据读取import pandas as pdimport numpy as npfrom IPython.core.interactiveshell import InteractiveShellInteractivShell.ast_node_interactivity = 'all'path = 'E:/exer/Datawhale/SecondHandCarPriceForecast/data/'## 1) 载入训练集和测试集;Train_data = pd

2021-04-13 11:12:52 44

原创 模型调参

建模与调参导入相关关和相关设置import pandas as pdimport numpy as npfrom sklearn.metrics import f1_scoreimport osimport seaborn as snsimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")读取数据reduce_mem_usage 函数通过调整数据类型,帮助我们减少数据在内存中占

2021-03-25 21:10:47 193

原创 Feature Selection

Task3 特征工程此部分为零基础入门心电图分类的 Task3 特征工程部分,带你来了解各种特征工程以及分析方法,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 零基础入门心电图分类项目地址:比赛地址:3.1 学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用3.2 内容介绍数据预处理时间序列数据格式处理加入时间步特征time特征工程时间序列特征构造特征筛选使用 tsfresh 进行时间序

2021-03-22 21:13:56 73

原创 EDA

#导入warnings包,利用过滤器来实现忽略警告语句。import osimport warningswarnings.filterwarnings('ignore')import missingno as msnoimport pandas as pdfrom pandas import DataFrame, Seriesimport matplotlib.pyplot as plt import seaborn as snsimport numpy as np#实现多输出结果的打印

2021-03-19 11:12:50 105

原创 datawhale baseline

datawhale baselinebaselinebaseline

2021-03-16 15:06:48 74

EDA探索性分析.md

自存

2021-03-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除