![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
kaggle
文章平均质量分 87
深度之眼
这个作者很懒,什么都没留下…
展开
-
Kaggle新赛:HMS-有害大脑活动分类大赛(信号分类)
专家标注员审查了50秒长的EEG样本,并匹配了覆盖10分钟窗口中心的频谱图,该窗口以相同的时间为中心,并标记了中心10秒。使用train.csv中的元数据选择特定的标注子集。它不仅耗时,而且手动审查脑电图记录费用也十分高昂,容易产生疲劳相关的错误,并且在不同的审查者之间存在可靠性问题。参赛者的工作将有助于自动化脑电图分析,帮助医生和大脑研究人员检测癫痫发作和其他可能导致脑部损伤的大脑活动类型,以便他们能够更快速、准确地进行治疗。由于测试集中没有重叠的样本,因此许多train元数据中的列不适用。原创 2024-01-27 17:55:19 · 3056 阅读 · 0 评论 -
kaggle新赛:SenNet 3D肾脏分割大赛(3D语义分割)
由于人体解剖学的变化以及HiP-CT技术不断改进和变化导致的图像质量变化,使用这种手动数据的机器学习方法无法很好地推广到新的数据集上。参赛者将创建一个模型,该模型在人类肾脏的3D分层相位对比断层扫描(HiP-CT)数据上进行训练,以帮助完成整个身体的血管结构图像。这个竞赛数据集包含了几张肾脏的高分辨率3D图像以及它们的血管结构的3D分割掩码。- 使用BM05的肾脏的一部分(500个切片),分辨率为50.16微米。- 包含用于图像的血液血管分割掩码的TIFF格式。的高分辨率子集,分辨率为5.2微米。原创 2023-11-19 18:45:00 · 933 阅读 · 0 评论 -
kaggle新赛:AI Village夺旗赛挑战
赛题名称:AI Village Capture the Flag @ DEFCON31赛题链接:https://www.kaggle.com/competitions/ai-village-capture-the-flag-defcon31。原创 2023-10-28 17:45:00 · 155 阅读 · 0 评论 -
kaggle新赛:UBC卵巢癌亚型分类和异常检测大赛【图像分类】
此外,医疗不发达的社区通常缺乏专科病理学家,即使是发达社区也面临缺乏妇科肿瘤专业知识的病理学家的短缺。参赛者的工作可以提高识别卵巢癌亚型的准确性,更好的分类将使临床医生能够制定个性化的治疗策略,而不受地理位置的限制。UBC卵巢癌亚型分类和异常检测(UBC-OCEAN)比赛的目的是对卵巢癌亚型进行分类,参赛者将在世界上最广泛的卵巢癌组织病理学图像数据集上训练模型,这些图像来自超过20个医疗中心。测试集包含与训练集不同的来源医院的图像,最大的区域图像几乎为100,000 x 50,000像素。原创 2023-10-18 17:27:50 · 956 阅读 · 1 评论 -
kaggle新赛:写作质量预测大赛【数据挖掘】
写作过程中存在复杂的行为动作和认知活动,不同作者可能采用不同的计划修订技术、展示不同的停顿模式或在全过程中策略性地分配时间,这些都可能影响写作质量。过去的研究探索了与停顿、添加删除和修订等行为相关的多种过程特征,但是使用的数据集较小,且只研究了少数特征。本次竞赛使用键盘日志的数据过程特征来预测总体写作质量,可能识别学习者写作行为与表现之间的关系。参赛者的工作将帮助探索学习者的书写行为与书写表现之间的关系,这可能为书写指导、自动书写评估技术和智能辅导系统的发展提供有价值的见解。(参见数据页面的描述)。原创 2023-10-10 16:11:14 · 1820 阅读 · 0 评论 -
kaggle新赛:Optiver 美股价格预测赛题解析
在技术创新的推动下,Optiver交易各种金融工具,如衍生品,现金股票,ETF,债券和外币,为全球主要交易所的数千种此类工具提供具有竞争力的双边价格。在纳斯达克交易所交易时段的最后十分钟,像Optiver这样的做市商将传统的订单簿数据与拍卖簿数据合并。在本次比赛中,您面临的挑战是开发一个模型,该模型能够使用订单簿和股票收盘价中的数据预测数百只纳斯达克上市股票的收盘价走势。您的挑战是预测个股相对于一个由纳斯达克上市股票构成的合成指数的未来价格变动。1个基点的价格变动相当于0.01%的价格变动。原创 2023-09-26 17:10:10 · 1444 阅读 · 1 评论 -
kaggle近三年NLP比赛top方案汇总及新赛推荐
NLP的赛题任务主要有文本分类、情感分析、关系抽取、文本匹配、阅读理解、问答系统等,自Google开发的NLP处理模型BERT被广泛应用后,目前解决NLP任务的首选方案就是深度学习方法(textCNN、LSTM、GRU、BiLSTM、Attention等),至于用哪种方法,得要看具体的比赛要求。kaggle上NLP相关的比赛还是比较少的,我这次就整理了,有缺漏欢迎大家补充,金牌方案也全部分享出来了。整理好的比赛baseline以及开源代码合集文末直接领取。原创 2023-09-13 18:21:03 · 1323 阅读 · 0 评论 -
2023kaggle计算机视觉竞赛top方案整理【baseline代码下载】
计算机视觉比赛可以分为多个任务,包括分类任务、分割任务、目标检测任务等,是kaggle比赛的重要方向之一,占比非常大。对于CV领域的同学来说,多打打这类的比赛能快速有效地帮助自己学习和运用所学知识。为了方便同学们学习,我整理了今年kaggle比赛中的计算机视觉方向的比赛,每场比赛的金牌方案也贴上了!鉴于有些同学登录github有些困难,我已经帮大家打包好了这些金牌方案的baseline开源代码,需要的同学文末领取。原创 2023-09-06 16:12:41 · 356 阅读 · 0 评论 -
kaggle新赛:谷歌AI模型运行时间预测赛题解析【数据挖掘】
ID是{collection}:{test_filename_without_extension},其中collection是tile:xla、layout:xla:random、layout:xla:default、layout:nlp:random和layout:nlp:default之一。她最近发现了编译器的配置,这些配置改变了编译器编译和优化模型的方式,从而使模型运行得更快(或更慢)。最终得分将是所有数据集的平均值。其中 K 是top-K预测,A 是数据集中给定图的所有配置,y 是测量的执行时间。原创 2023-09-01 17:07:51 · 708 阅读 · 0 评论 -
kaggle推荐系统比赛top方案汇总【附baseline代码】
推荐系统可以很好地解决信息过载以及信息不足等问题,广泛应用与电商、金融、新闻咨询、社交、旅游等行业,其中最典型并具有良好的发展和应用前景的领域就是电子商务领域。在学术界,推荐系统同样是热门的研究方向,在各大顶会中的论文数目相当可观。在kaggle平台,推荐系统相关的竞赛同样也不少。这次我就帮同学们整理了部分kaggle推荐系统比赛,各场比赛的也分享了,文末领取。原创 2023-08-23 18:18:48 · 1392 阅读 · 0 评论 -
【数据挖掘】Kaggle ICR 医疗诊断大赛金牌方案汇总
在后续的尝试中,我试图通过发明各种新的特征来扩展特征空间,填补空白的复杂化,例如,我试图预测epsilon和row_id,但在交叉验证中没有得到任何改进,而且结果变得更不稳定,所以我意识到这些复杂化只会导致过度训练,于是我停止了这些尝试。由于特征是匿名的,与健康相关的医疗特征,我最初的想法是通过不同特征之间的比率构建新的特征,就像体检报告中的一些指标也是通过其他指标的比率计算出来的。我们删除了time为None的行,当我用UMAP玩数据时,注意到一个奇怪的聚类远离其他所有数据,正是time缺失的行。原创 2023-08-20 18:15:00 · 305 阅读 · 0 评论 -
Kaggle图像匹配大赛TOP方案分享【附金牌开源代码】
我们提出了一个从粗到细的SfM框架,以从最近无检测器匹配器的成功中获益,同时解决无检测器匹配器的多视图不一致问题。原创 2023-08-12 18:15:00 · 430 阅读 · 0 评论 -
kaggle时间序列竞赛top方案汇总
时间序列预测作为机器学习中的一项常见的任务,应用场景非常广泛,比如电力能源、交通流量、股票价格、天气变化、疾病等预测,在各个领域中都具有非常重要的作用。我们遇到的很多预测问题其实都能看作是时序预测问题,在数据挖掘竞赛中,时间序列预测相关的竞赛也占了相当大的一部分。上次分享的是,感兴趣的同学点蓝字传送。原创 2023-08-02 17:41:30 · 898 阅读 · 0 评论 -
kaggle新赛:RSNA 2023 腹部创伤检测大赛赛题解析(CV)
腹部钝力创伤是最常见的创伤性损伤类型之一,最常见的原因是机动车事故。来自数十台不同CT机器的扫描已经过重新处理,以使用运行长度编码无损压缩格式,但保留了其他差异,例如每像素的位数,像素范围和像素表示。为此目的开发先进的算法有可能改善全球的创伤护理和患者预后。本次比赛的目标是在创伤患者的CT扫描中识别几种潜在的伤害。请注意,标记为健康的患者可能仍有其他医疗问题,例如癌症或骨折,这些问题恰好不在竞争标签的涵盖范围内。对于测试集中的每个患者 ID,参赛者必须预测每种不同可能的损伤类型和程度的概率。原创 2023-07-29 16:40:15 · 590 阅读 · 2 评论 -
Kaggle图表内容识别大赛TOP方案汇总
骨干微调得到的图像文本模型。预测数据系列通过两个指标的组合进行评估:分类(即字符串)数据类型的 Levenshtein 距离和数值数据类型的 RMSE,图表类型和序列中的值数具有初始完全匹配标准。对于没有提供注释的数据,我首先视觉检查了所有数据的外观,选择了可以在本次比赛中使用的数据。单个图形的数据系列包含两个用于评估的实例:沿 x 轴的一系列值和沿 y 轴的相应值系列。在数据系列推断阶段,条形图、折线图和散点图通过为每个图表类型单独训练的Deplot进行端到端预测,而散点图则通过基于目标检测的方法预测。原创 2023-07-26 16:40:33 · 170 阅读 · 0 评论 -
kaggle新赛:Bengali.AI 语音识别大赛赛题解析
孟加拉.AI语双管齐下的方法的所有结果,包括数据集和训练模型,都是开源的,供公众使用。参赛者将构建一个基于第一个大规模众包 (MaCro) 孟加拉语语音数据集训练的模型,其中包含来自印度和孟加拉国的约24,000人提供的1,200小时的语音数据作为训练数据。参赛者在本次竞赛中的工作可能会对世界上最流行但资源匮乏的语言之一的语音识别改进产生影响。此外,参赛者提交的内容将是孟加拉语的首批开源语音识别方法之一。:测试集,包含来自18个不同领域的自发语音录音,其中17个领域与训练集不同。:录音的纯文本转录。原创 2023-07-24 17:24:35 · 806 阅读 · 0 评论 -
kaggle飞机凝结轨迹识别赛题解析+baseline代码
利用语义分割在卫星图像中识别对流尾迹。原创 2023-07-21 17:00:00 · 211 阅读 · 0 评论 -
kaggle新赛:学生摘要评估大赛赛题解析(NLP)
赛题名称:CommonLit - Evaluate Student Summaries赛题链接: https://www.kaggle.com/competitions/commonlit-evaluate-student-summaries/原创 2023-07-19 16:31:49 · 863 阅读 · 0 评论 -
kaggle金融量化竞赛top方案汇总
看了一下今年的研究生项目,金融量化果然还是烫门,录取分数线越来越高,申请人数依然居高不下,这么多人拼命卷...目前来看,只卷学历,理论知识肯定是不够的,还得要实战背景,对于学生来说,最好获取实战经验的方式就是实习、打比赛,前者也得要先获得实习资格,后者就完全可以靠自己努力发挥了。但金融领域的国际竞赛也不常见,所以作为最高含金量的竞赛之一,kaggle金融量化相关的比赛就显得尤为珍贵。今天我就帮同学们整理了了,后续如果有新的也会来更新的(如果忘了欢迎大家来提醒!另外,我的大佬朋友还分享过自己的,以及。原创 2023-07-06 17:11:43 · 964 阅读 · 0 评论 -
kaggle新赛:肾脏血管分割大赛赛题解析(CV)
用AI为医疗贡献一份力量,从加入本次竞赛开始!HuBMAP - Hacking the Human Vasculature 从人肾组织切片中分割微血管结构。原创 2023-06-29 17:39:30 · 352 阅读 · 0 评论 -
kaggle新赛:ICR疾病预测大赛赛题解析
赛题名称:ICR - Identifying Age-Related Conditions ICR疾病预测大赛赛题链接:https://www.kaggle.com/competitions/icr-identify-age-related-conditions。原创 2023-06-12 18:01:41 · 449 阅读 · 0 评论 -
kaggle官方书籍推荐:The-Kaggle-Book
参加 Kaggle 竞赛是提高数据分析技能、与社区其他人建立联系并获得宝贵经验以帮助发展职业生涯的可靠方式。这本书汇集了你在竞赛、数据科学项目等方面取得成功所需的技术和技能。两位 Kaggle 大师将引导你完成在其他地方不容易找到的建模策略,以及他们在此过程中积累的隐性知识。除了特定于 Kaggle 的技巧外,你还将学习基于图像数据、表格数据、文本数据和强化学习来处理任务的更多通用技术。无论你是想攀登Kaggle的行列,培养更多的数据科学技能,还是提高现有模型的准确性,这本书都是为你准备的。原创 2023-05-26 17:44:50 · 1682 阅读 · 8 评论 -
kaggle新赛推荐 | 从游戏中预测学生的表现
Predict Student Performance from Game Play 从游戏中预测学生的表现。原创 2023-05-25 17:23:42 · 352 阅读 · 0 评论 -
kaggle帕金森病进展预测大赛金牌方案分享
该伙伴关系创建了AMP PD知识平台,其中包括帕金森病患者的深层分子表征和纵向临床分析,目的是识别和验证帕金森病的诊断,预后和/或疾病进展生物标志物。对于每个采集蛋白质/肽样本的患者访问,参赛者需要估计他们在该次访问中的UPDRS得分,并预测其6、12和24个月后任何可能出现的访问得分。运动障碍协会赞助的统一帕金森病评定量表(MDS-UPDRS)修订版是对与帕金森病相关的运动和非运动症状的全面评估。您的工作可以帮助寻找治疗帕金森病的方法,这将减轻这种疾病患者的大量痛苦和医疗费用。指示就诊期间是否采血。原创 2023-05-22 17:18:43 · 299 阅读 · 0 评论 -
kaggle经典赛 | IEEE欺诈检测竞赛金牌方案分享
一旦你意识到这一点,你就会知道这场竞赛的挑战是建立一个可以预测看不见的客户(不是看不见的时间)的模型。每个客户进行许多交易,蓝线的左端是他们时间的第一笔交易,右端是最后一笔交易。竞赛的排名是根据提交的测试集预测结果的ROCAUC得分来确定的,得分越高排名越靠前。尴尬,并且确定您有足够的资金来支付 50 个最亲密朋友的史诗般的玉米片派对所需的一切,您再次尝试您的卡。对抗性验证具有AUC=1的原因不是因为欺诈的性质随着时间的推移而发生根本性的变化,而是因为数据集中的客户端随着时间的推移而发生根本性的变化。原创 2023-05-18 17:58:03 · 389 阅读 · 0 评论 -
语音识别 | kaggle鸟叫识别新赛赛题解析
整理自kaggle平台BirdCLEF 2023 kaggle - 鸟声识别大赛。原创 2023-05-15 17:30:21 · 494 阅读 · 0 评论 -
kaggle新赛 | 飞机凝结轨迹识别大赛
凝结尾迹占人类造成的全球变暖的大约 1%,使用卫星图像的目的是确认已有的模型的预测效果。原始卫星图像是从GOES-16 Advanced Baseline Imager (ABI)获得的,它在Google Cloud Storage上公开可用。Contrails 是“凝结轨迹”的缩写,是在飞机发动机排气中形成的线状冰晶云,由飞机飞过大气中的超潮湿区域时产生。持续的尾迹对全球变暖的贡献与它们为飞行所燃烧的燃料一样多。为了减小提交文件的大小,我们的指标对像素值使用游程编码。第三名 - $ 8,000。原创 2023-05-14 18:15:00 · 250 阅读 · 0 评论 -
kaggle往期赛 | 海星目标检测比赛银牌经验分享
最终获得前2%的成绩,简单点就是银牌🥈!原创 2023-03-20 17:37:42 · 796 阅读 · 0 评论 -
【kaggle】印度语和泰米尔语问答赛题baseline
在本次比赛中,目标是预测有关 Wikipedia 文章的真实问题的答案。原创 2022-11-23 15:44:22 · 390 阅读 · 0 评论 -
【kaggle】鲸鱼海豚分类银牌baseline
作者:Zeta来源:投稿编辑:学姐最早在知乎上看到的kaggle比赛解析就三年前的座头鲸分类比赛原创 2022-11-17 18:03:05 · 599 阅读 · 0 评论 -
【NLP】kaggle临床患者病历评分比赛baseline
来源:投稿作者:William编辑:学姐William研究生毕业于美国TOP20大学现就职国内某互联网大厂赛题分析+baseline1、赛题链接https://www.kaggle.com/c/nbme-score-clinical-patient-notes2、赛题描述本次竞赛的目标是通过建立一个模型来将不同病情的临床表现在病例中找出,具体而言就是将病情描述+病人病例 一起输入模型, 在病例中提取出对应的span位置。...原创 2022-03-02 18:31:20 · 1836 阅读 · 0 评论 -
2022DCIC智慧农业赛题-牛只图像分割竞赛baseline
Frankie :目前本科在读,师从深度之眼比赛班导师-Taylor老师,刚接触图像算法竞赛半年,已经获得 IFLYTEK 1024 Challenge - X光目标检测第二名,华为云-重庆语义分割算法大赛二等奖等。1、赛题链接智慧农业赛题——牛只图像分割竞赛 赛道详情 - 数字中国2、赛题描述&任务牛只图像分割是智慧畜牧中的重要一环,既实现牛只的智能个体识别,还能掌握牛在养殖过程中的生长状况。本赛题旨在用人工智能为畜牧养殖赋能,使用机器代替饲养员对牛只进行个.原创 2022-02-23 11:26:37 · 1723 阅读 · 0 评论 -
Kaggle-海底海星目标检测Baseline
Kaggle-海底海星目标检测BaselineFrankie : 目前本科在读,师从深度之眼比赛班导师-Taylor老师,刚接触图像算法竞赛半年,已经获得 IFLYTEK 1024 Challenge - X光目标检测第二名,华为云-重庆语义分割算法大赛二等奖等。1、赛题链接https://www.kaggle.com/c/tensorflow-great-barrier-reef2、赛题描述本次竞赛的目标是通过建立一个在珊瑚礁水下视频中训练的物体检测模型,实时准确地识别海星。商业价值:帮助原创 2022-01-07 15:27:15 · 3898 阅读 · 0 评论 -
Optiver股价波动率预测,附量化因子baseline+金牌开源代码
Kaggle 上近日发布了一个时间序列方向的新赛:Optiver Realized Volatility Prediction,即“ 股票市场波动率预测 ”比赛。奖金10W美刀,要求参赛者构建模型预测不同行业数百只股票的短期波动。这是一个 时间序列预测 的任务,整体难度不大,适合机器学习/深度学习初学者参加。此外,本次比赛还涉及到金融行业的 量化交易 知识,对此感兴趣的同学千万不要错过。1 比赛简介比赛名称:Optiver Realized Volatility Prediction比赛链接:h.原创 2021-08-29 22:32:16 · 3936 阅读 · 1 评论 -
Kaggle比赛:用深度学习模型寻找外星人
大赛简介大赛名称:SETI Breakthrough Listen - E.T. Signal Searc比赛链接:https://www.kaggle.com/c/seti-breakthrough-listen/overview赛题背景“我们一个人在宇宙里吗?”这是最深刻且长期存在的人类问题之一。随着技术的进步,我们正在寻找新的和更强大的方法来寻求答案。加州大学伯克利大学使用世界上最强大的望远镜对数百万颗恒星进行技术扫描。现在希望Kaggle社区能够帮助解释他们收到的信号。加州大学伯克利分校的原创 2021-08-04 16:25:26 · 674 阅读 · 1 评论 -
基于预训练模型的文本回归任务解决方案
赛题背景阅读是取得学术成功的一项基本技能。当学生联系阅读挑战性的文章时,他们自然就会培养阅读能力。当前教育课本使用传统的可读性方法与读者进行匹配。但是它们缺乏构造和理论有效性。CommonLit 是一家非营利性教育技术组织,为超过2000万名师生提供3至12年级的免费数字阅读和写作课程。赛题任务在本竞赛中,您将构建算法来评估3-12年级课堂使用的阅读文章的复杂程度。赛题数据集包括来自各个年龄段的读者以及来自各个领域的大量文本。获胜的模型将确保结合文本衔接和语义。本竞赛开发的算法将帮助教师和学生能原创 2021-08-02 23:17:30 · 1305 阅读 · 0 评论 -
Kaggle 虾皮商品匹配大赛多模态基线模型
Shopee — Price Match Guarantee 竞赛介绍Shopee Price Match Guarantee比赛希望我们能够从商品的图片、标题判断哪些是同样的商品简单来讲,像是如果我在虾皮上面搜寻「switch」这个词会出以下页面。而可以看到上面其实有些是Switch主机,有些是switch+健身环,有些则是保护壳、收纳袋之类的,这次的比赛就是希望能够仅从「图片+商品标题」判断出来哪些是同样的商品,借此shopee能够做出更精准的商品推荐、比价、甚至可能可以做假货分析(同样商品原创 2021-07-19 16:03:53 · 1110 阅读 · 0 评论