- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 datawhale OCR task1
环境配置paddlepaddle其他环境python3GPU步骤1:下载比赛图片python3 down_image.py保存目录为train_data/tianchi/image,按照文件名进行保存,训练集和测试集存储在一起。步骤2:下载预测模型由于OCR包括多个步骤,此时我们只对其中检测的部署进行fientune,所以其他部署的权重也需要下载。mkdir inference && cd inference/# 下载模型wget https://paddle
2021-07-14 20:20:53 61
原创 Task5 模型融合
回归\分类概率-融合:简单加权平均,结果直接融合## 生成一些简单的样本数据,test_prei 代表第i个模型的预测值test_pre1 = [1.2, 3.2, 2.1, 6.2]test_pre2 = [0.9, 3.1, 2.0, 5.9]test_pre3 = [1.1, 2.9, 2.2, 6.0]# y_test_true 代表第模型的真实值y_test_true = [1, 3, 2, 6] import numpy as npimport pandas as pd
2021-04-24 17:04:09 106
原创 Task4 建模调参
读取数据import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')#reduce_mem_usage 函数通过调整数据类型,减少数据在内存中占用的空间def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type to r
2021-04-22 17:13:54 169
原创 Task3 特征工程
特征工程导入数据import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snsfrom operator import itemgetter%matplotlib inlinetrain = pd.read_csv('train.csv', sep=' ')test = pd.read_csv('testA.csv', sep=' ')
2021-04-19 14:29:53 121
原创 Task2 数据分析
数据探索性分析#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport missingno as msno载入数据## 1) 载入训练集和测试集;Train_data = pd.read_csv('t
2021-04-16 10:06:54 170
原创 Task1 赛题理解
二手车价格预测task1数据读取import pandas as pdimport numpy as npfrom IPython.core.interactiveshell import InteractiveShellInteractivShell.ast_node_interactivity = 'all'path = 'E:/exer/Datawhale/SecondHandCarPriceForecast/data/'## 1) 载入训练集和测试集;Train_data = pd
2021-04-13 11:12:52 52
原创 模型调参
建模与调参导入相关关和相关设置import pandas as pdimport numpy as npfrom sklearn.metrics import f1_scoreimport osimport seaborn as snsimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")读取数据reduce_mem_usage 函数通过调整数据类型,帮助我们减少数据在内存中占
2021-03-25 21:10:47 197
原创 Feature Selection
Task3 特征工程此部分为零基础入门心电图分类的 Task3 特征工程部分,带你来了解各种特征工程以及分析方法,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 零基础入门心电图分类项目地址:比赛地址:3.1 学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用3.2 内容介绍数据预处理时间序列数据格式处理加入时间步特征time特征工程时间序列特征构造特征筛选使用 tsfresh 进行时间序
2021-03-22 21:13:56 83
原创 EDA
#导入warnings包,利用过滤器来实现忽略警告语句。import osimport warningswarnings.filterwarnings('ignore')import missingno as msnoimport pandas as pdfrom pandas import DataFrame, Seriesimport matplotlib.pyplot as plt import seaborn as snsimport numpy as np#实现多输出结果的打印
2021-03-19 11:12:50 109
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人