数据竞赛
文章平均质量分 63
YueTann
个人记录, 毫无章法
展开
-
IJCAI Track 2 Forecasting Future Turn-Based Strokes in Badminton Rallies - baseline学习
需要注意的是6月13号发布的测试数据集,所以之前的成绩似乎是A榜,并不完全重要。原创 2023-05-27 00:35:40 · 455 阅读 · 1 评论 -
Parkinson‘s Freezing of Gait Prediction- baseline 学习
【代码】Parkinson‘s Freezing of Gait Prediction- baseline 学习。原创 2023-05-20 09:40:59 · 591 阅读 · 0 评论 -
CAFA5 baseline学习
本次比赛的目标是预测一组蛋白质的功能。您将开发一个模型,该模型根据蛋白质的氨基酸序列和其他数据进行训练。您的工作将帮助研究人员更好地了解蛋白质的功能,这对于发现细胞、组织和器官的工作方式非常重要。这也可能有助于开发针对各种疾病的新药和疗法。预测列表包含蛋白质目标和 GO 术语之间的成对列表,然后是关系的概率估计注意过拟合:这是一个前瞻性(即未来)的数据竞赛。测试数据中的许多蛋白质目前没有任何指定的功能。研究人员在比赛策划阶段发表的具有一项或多项功能的蛋白质将构成未来的测试集。原创 2023-05-10 13:16:19 · 470 阅读 · 1 评论 -
Predict Student Performance - baseline学习
通过学习以上baseline进行学习。原创 2023-05-14 22:51:54 · 216 阅读 · 0 评论 -
芒果用户未来价值预估 baseline学习
3.一个用户未来7天一共观看了1000秒,代表这个用户7日观看视频时长为1000。1.一个用户的7日留存分等于3,代表这个用户未来的7天里,有3天会访问芒果TV。2.一个用户未来7天观看了20次视频,代表这个用户7日观看视频次数为20。过去一段时间的活跃天数,观看视频数量,观看时长的统计特征。我们从三个层面定义用户未来价值。用户观看行为序列数据。原创 2023-05-10 13:16:07 · 624 阅读 · 0 评论 -
Riiid Answer Correctness Prediction - lgb baseline 学习
使用的五个特征含义分别是。原创 2023-05-19 23:59:03 · 377 阅读 · 0 评论 -
knowledge tracing baseline解读-注释版本
aaai2023原创 2022-11-26 23:58:30 · 557 阅读 · 0 评论 -
时间序列-源码解读-gluonts
tfts原创 2022-10-12 10:26:15 · 818 阅读 · 0 评论 -
九月比赛流水-零基础入门应用赛
应用赛原创 2022-10-11 23:53:01 · 248 阅读 · 0 评论 -
我的开源比赛工具介绍
开源与比赛原创 2022-10-11 21:28:38 · 801 阅读 · 0 评论 -
KDD Cup 2022百度-风机功率预测实验记录
实验编号:100规则法:Total: 0.26124, MAE: 0.23134, RMSE: 0.29114RNN: Total: 0.25920, MAE: 0.23275, RMSE: 0.28565原创 2022-05-20 11:40:27 · 645 阅读 · 0 评论 -
第三届山东大数据-威海赛区-民宿空置预测-排行榜
山东大数据原创 2022-03-04 10:23:23 · 1445 阅读 · 0 评论 -
第四届工业大数据创新竞赛-Top1方案
以下来自我的队友,有幸通过这场比赛认识了大佬,后来我们继续用YueTan的名字参加了多次比赛,公众号YueTan也慢慢的交给大佬来打理了。说起来感觉很奇怪的事,大佬后来出去也自称YueTan了,我都分不清了。以下是他的解决方案...原创 2022-03-03 11:28:37 · 1964 阅读 · 3 评论 -
创新学习对象1-陕西省网络与系统安全重点实验室研究员的李光夏老师
第一位: 陕西省网络与系统安全重点实验室研究员的李光夏老师特别鼓励努力发明、改善模型的团队,真实场景中没有可以参考的数据集。竞赛也考察创新,不仅仅是线上的成绩和排名。李老师表示真实场景没有可以参考的数据集,我看不懂,但大受震撼。李老师还表示,我们也考察创新,咱们不如去学习一下李老师的创新。检测到了这里:https://dblp.uni-trier.de/pid/23/8127.html李老师的一作文章涉及到在线学习、多任务学习、cyber security、industrial control原创 2022-01-25 23:48:25 · 2336 阅读 · 0 评论 -
阿里云供应链大赛-榜单
客观排名最终排名gong原创 2022-01-25 11:49:18 · 513 阅读 · 0 评论 -
参加天池大数据竞赛是怎样一种体验?
参加过三次比赛,三次Top5,但是我想说:狗都不做好的部分工作人员的耐心和付出非常值得肯定,无论是技术还是非技术的支持我一直心怀感激一些赛题很新颖,例如工程赛或工程加算法赛不好的部分第一场AI earth比赛:季军是小号刷的由于大佬复现出了问题,所以我从B榜第5变成了第4,但是季军作为主办学校团队问题大了。比赛12点结束提交后还有很多队伍没有训练完,所以大家可能还有一次提分机会。16点南京某大学的人在最后一次训练里非常牛逼的上来了。17点,另一个队伍的最后一次训练也上来了,吊本来惊叹牛原创 2022-01-22 14:55:29 · 2160 阅读 · 0 评论 -
数据竞赛:如何小号作弊
以下内容,纯属虚构,如有雷同,我就删除。以后学着做一些门槛高一些的比赛,少往水沟里钻。know-how大家好,我是数据初学者、阴阳怪气带师oh.亨利,今天给大家演示一下如何在比赛中作弊。每个人成长的过程中都会作弊,别看一些平时人模狗样的,还不都是作弊的既得利益者,现在稍微有了点成绩就想焊上车门阻止其他人。一开始,我有些大意,两个号ID起的有些关联,被别有用心的人发现了。但是我并没有损害任何人的利益,因为小号并没有进入复赛,虽然我有动机,但并没有实现。你不能因为我说想杀人,就说我是杀人犯。有些伞兵一点法原创 2021-12-21 16:54:10 · 637 阅读 · 0 评论 -
答辩攻略之二:纯方案赛
声明:本文纯属巧合,如有雷同,这不是巧了嘛背景之前介绍过数据竞赛答辩之最强攻略,如何进一步推向极致呢?答案就是参加方案赛。完全没有客观成绩的前提,如何取的好成绩呢?纯方案赛有两种类型。一种是给定数据和任务的,针对个人开发者,也就是框定了大致范围;另一种是完全自由发挥,主要针对的是企业,介绍自己的产品。第一种我没参加过,重点是可视化、故事、insight。这里讲讲我参加过的第二种,也就是大家各自介绍自己的产品。成绩首先,重要程度来看,背景大于实力。准确来说背景就是一切,人情社会嘛,不寒碜。我笑他人不.原创 2021-12-21 13:34:55 · 325 阅读 · 0 评论 -
2021第二届全球工业互联网算法大赛-榜单
比赛链接: http://iiac.vip/比赛榜单:原创 2021-09-10 13:26:04 · 422 阅读 · 0 评论 -
第五届工业互联网大数据:配件需求29th方案与代码
背景大数据可能过时了,所以这个延续5年的比赛也换了名字,但我还是习惯叫工业大数据。之前文章介绍过,我做了风力预测赛道但排不进排行榜。这里介绍一下队友在配件预测赛道的方案,方案很简单,不到50行代码,取得决赛29th的成绩。其实,我也做了一点,入手了一个LGB模型,但是效果一直没有超过全0,尴尬的放弃了。任务是预测未来三个月的配件需求,评价指标类似MAPE,所以准确预测小目标才是关键。代码地址:https://github.com/hongyingyue/Data-science-demos方案##原创 2021-12-11 21:51:49 · 2225 阅读 · 0 评论 -
2021 “AI Earth”人工智能创新挑战赛 AI助力精准气象和海洋预测
2021年,天池仍然活跃着很多小号刷榜的行为。比如AI earth比赛12点结束提交后还有很多队伍没有训练完,所以大家可能还有一次提分机会。16点南京某大学的人在最后一次训练里非常牛逼的上来了。17点,另一个队伍的最后一次训练也上来了,太吊了。本来惊叹大家牛逼,纷纷利用最后一次机会上分。不过这位矿大人工智能的选手良超 (后面会继续出现) 在群里自曝自己没有端对端训练。自己来群里博取一波遗憾,然后找主办方取消了这次成绩本来一切都很正常,直到这位冒充矿业大学的选手良超暴露了其实也是某某大学ail原创 2021-12-10 13:27:26 · 2101 阅读 · 0 评论 -
数据竞赛:记录3天进入比赛Top3%的全过程
原文首发于我的公众号这几天花了3天时间尝试了一个CCF比赛:大数据时代的Serverless工作负载预测。比赛链接:https://www.datafountain.cn/competitions/468/teams这里简单记录一下如何利用三天时间进入Top3%,虽然有2000多队伍,很多人其实从来都没有认真做过,三天时间本身就超过80%的人了。所以Top3%,其实真没什么难度,有巨大难度的是Top5,所以标题党了一下。数据概览比赛类型为时间序列预测。背景:云计算时代,Serverless软件架构原创 2020-12-04 21:08:56 · 327 阅读 · 1 评论 -
数据竞赛:第四届工业大数据竞赛-虚拟测量
原文首发于我的公众号背景注塑成型作为做常见的一种塑料制品加工工艺,它所加工的产品在生活中随处可见,例如电子产品、汽车配件、玩具以及其他众多消费品。由于成型系统较为复杂并且对环境较为敏感,注塑成型加工过程中的不稳定因素很容易导致产品不良的发生,造成经济损失。所以我们建立注塑成型大数据,来感知这些不可见的干扰因素,然后通过分析建模解决甚至避免现场痛点问题。比如成型过程的异常检测预警及不良品的识别,有助于减少甚至避免不合格品的产生,对于管控产品质量、降低生产成本有重要的作用。同时,针对异常产生现场人员因经验差原创 2020-11-29 09:48:11 · 2582 阅读 · 2 评论 -
数据竞赛:联通套餐个性化匹配
机器学习是一个理论结合实践的学科,手头没有实际数据和案例的时候,看一看数据竞赛就不错。这是2018年的一个数据比赛,当年第一、第二的优秀选手都慷慨分享了他们的代码,可以根据代码回顾一下Top选手当时的思路,共同学习一下。原文首发与我的公众号背景比赛链接:https://www.datafountain.cn/competitions/311电信产业作为国家基础产业之一,覆盖广、用户多,在支撑国家建设和发展方面尤为重要。随着互联网技术的快速发展和普及,用户消耗的流量也成井喷态势,近年来,电信运营商推原创 2020-11-29 09:37:15 · 535 阅读 · 0 评论 -
赛后总结:第四届工业大数据竞赛注塑成型
赛后总结:第四届工业大数据竞赛注塑成型原文首发于我的公众号前言以第四届工业大数据竞赛虚拟量测任务为例,介绍大家的思路。自己代码乱写,导致不知道最后要复现的是哪个,加上工作上各种人员优化,就没有进一步。虽然放弃比赛,但对数据掌握的还算透彻,刚好决赛也都有答辩视频,就我个人理解和优秀选手的开源,在这里和大家一起分享一下。比赛链接:http://www.industrial-bigdata.com/Competition只有一次评分的机会,本以为是摸奖赛,但前排还是很稳健。祝贺各位优秀的选手,也通过直播原创 2020-11-29 09:28:38 · 863 阅读 · 1 评论