竞赛项目
文章平均质量分 89
kaggle,天池
dlvector
be better man,基础不牢,地动山摇!
展开
-
2020kaggle年度调查报告
Top visualization libraries: Matplotlib, Seaborn, Ggplot / ggplot2Top machine learning frameworks: Scikit-learn, TensorFlow, KerasTop big data products: PostgresSQL, MongoDB, Microsoft SQL ServerTop BI tools: Tableau, Microsoft Power BI, Data StudioTop原创 2021-01-10 21:03:19 · 170 阅读 · 0 评论 -
竞赛回顾:脊柱疾病智能诊断大赛
先说结果:复赛27/3107,只能说一般般,没有打入前top20,并没有实现自己的目标。但是也是收获了不少经验,做一些总结和分享。失败的经验:尽早开始,尽快搭建自己的整套pipeline,后面再去增加的自己的idea,不断检验自己的idea.可以准备一些自己的pipeline模板,这样可以加速开发。想办法和大佬合作吧,和大佬一起合作。贴一张最后决赛的结果:其中GPU第一队,基本是大佬合集,看个人简介就知道,经常获得冠军的队。也是唯一一个实现map超过0.7的对。自己的实现思路:Unet原创 2020-11-08 23:05:35 · 2800 阅读 · 8 评论 -
每天一kernel:正太概率图
kernel位置COMPREHENSIVE DATA EXPLORATION WITH PYTHON这个kernel从头到尾的分享了自己是如何选取特征的,内容还是很详实的。总结一下:用一张表格记录自己选择特征的一些分析信息,重要程度。先分析目标女神她的兴趣(与其他变量之间的关系:箱图,散点图)相关矩阵来衡量特征之间的重要性处理缺失值,离群值标准化,方差齐性,线性化,缺少相关错误...原创 2020-03-11 23:19:52 · 895 阅读 · 0 评论 -
每天一kernel:偏度和峰度
竞赛:波士顿房价预测学习kernel:房价预测kaggle入门项目https://www.kaggle.com/dgi1995/kaggle?scriptVersionId=29957072提交结果:0.30,这个成绩一般般,主要是这个kernel没有对一些不是数值的类型进行one-hot编码,而且选择特征只用了corr相关系数前十,没有细致的探究。今天的感想:要学习一个东西,就要花时...原创 2020-03-10 23:46:26 · 129 阅读 · 0 评论