
【自己】kaggle赛题相关
文章平均质量分 85
kaggle赛题相关
双木的木
种一棵树最好的时间是十年前,其次是现在。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Coggle数据科学 | 科大讯飞AI大赛:人岗匹配挑战赛 赛季3
讯飞智聘是一款面向企业招聘全流程的智能化解决方案。运用科大讯飞先进的智能语音、自然语言理解、计算机视觉等AI技术及大数据能力,具备业界领先的简历解析、人岗匹配、AI面试、AI外呼等产品功能,助力企业提升招聘效率,降低招聘成本。人岗匹配是企业招聘面临一个重大挑战,尤其在校园招聘等集中招聘的场景下,面对海量的简历,如何快速分类筛选出最适合招聘岗位的简历,以及在内推和猎头场景下,如何为一份简历找到合适的岗位,做到人适其岗、岗适其人,提升人岗匹配的效率和准确度,是困扰每一个HR和面试官的难题。原创 2024-09-14 22:48:53 · 1432 阅读 · 2 评论 -
Coggle数据科学 | Kaggle干货:自定义transformers数据集
transformers是现在NLP同学必备的库,但在使用的过程中主要的代码是需要自定义数据集,那么如何舒服的读取数据,并使用transformers进行训练模型呢?原创 2024-07-24 17:45:20 · 1200 阅读 · 0 评论 -
Coggle数据科学 | Streamlit + LangChain 问答可见即所得~
LangChain是一个框架,旨在开发由语言模型驱动的应用程序。它不仅仅是通过API调用语言模型,还提供了数据感知、代理性质和一系列模块支持,使开发者能够构建更强大、更灵活的应用程序。原创 2024-03-10 18:00:34 · 1755 阅读 · 0 评论 -
Coggle数据科学 | Coggle 4月竞赛学习:多模态图文问答
在自然语言处理领域,大型语言模型(LLM)如GPT-3、BERT等已经取得了显著的进展,它们能够生成连贯、自然的文本,回答问题,并执行其他复杂的语言任务。但想要让大模型回答复杂问题,需要对原始内容进行深入的理解,比如对数据库进行解析、图像、语音等内容进行解析。原创 2024-04-21 18:08:12 · 1369 阅读 · 0 评论 -
Coggle数据科学 | KDD Cup 2024:亚马逊LLMs购物挑战
在线购物是一个复杂的过程,涉及从浏览到购买的各种任务,都需要洞察客户的行为和意图。这需要能够利用任务之间共享知识的多任务学习模型。然而,许多当前的模型都是特定于任务的,增加了开发成本,限制了效果。大型语言模型(LLMs)有潜力改变这一状况,通过一个模型处理多个任务,并通过微小的提示调整实现。在LLMs的潜力和挑战的推动下,我们推出了 ShopBench,一个针对在线购物的大规模挑战,包含 57 个任务和约 20000 个问题,来源于真实的亚马逊购物数据。原创 2024-04-20 19:29:39 · 1701 阅读 · 0 评论 -
kaggle竞赛宝典 | 两大Kaggle时序金牌级强特
今天介绍在时间序列中非常强势的两个特征,这些特征在一些序列问题分类以及回归问题中起到非常大的作用,在非常多的问题中都展现了极好的效果。原创 2024-03-24 13:29:15 · 431 阅读 · 0 评论 -
Coggle数据科学 | Kaggle知识点:Ensemble PyTorch
在当今的深度学习领域,集成学习(Ensemble Learning)是一种广受欢迎的方法,通过组合多个模型的优势来提升整体性能。为了简化集成学习模型的构建和应用,Ensemble-PyTorch提供了一种便捷且高效的解决方案。原创 2024-07-21 17:44:55 · 1236 阅读 · 0 评论 -
kaggle竞赛宝典 | 时间序列和时空数据大模型综述!(建议收藏!)
大型语言模型(LLM)和预训练基础模型(PFM)在自然语言处理(NLP)、计算机视觉(CV)等领域有广泛应用。时间序列和时空数据本质上都是时间数据,将这两个广泛且内在联系的数据类别的研究结合起来至关重要。尽管深度学习和自监督预训练方法在时间序列和时空数据分析领域逐渐取得进展,但统计模型仍占主导地位。原创 2024-03-21 15:49:28 · 2276 阅读 · 0 评论 -
kaggle竞赛宝典 | 数据竞赛三剑客变四剑客了~
早期做数据竞赛的时候,常听大家戏称Catboost,Xgboost和Lightgbm为竞赛三剑客,如今,在诸多的竞赛中,又多了一位HistGradientBoosting,该算法基本也会出现在所有的竞赛问题中。例如:Steel Plate Defect Prediction竞赛中第二名的模型就是用到了HistGradientBoostingClassifier。原创 2024-04-25 20:08:00 · 574 阅读 · 0 评论 -
kaggle竞赛宝典 | 时序表示学习的综述!
本文综述了时间序列数据中的通用表示学习方法,提出了一种新颖的分类方法,并讨论了其对提高学习表示质量的影响。文章全面回顾了各种神经网络架构、学习目标和数据相关技术,并总结了常用的实验设置和数据集。原创 2024-07-23 21:04:14 · 1108 阅读 · 0 评论 -
kaggle竞赛宝典 | 效果惊人的基于图的时间序列异常检测方法
时间序列异常检测(TSAD)在各种应用中具有重要性,但面临挑战,需同时考虑变量内和变量间依赖性,基于图的方法在应对这方面取得了进展。本文全面回顾了基于图的TSAD,探讨了图表示学习在时间序列数据中的潜力,回顾了最新图异常检测技术及其优缺点,并讨论了可能的技术挑战和未来方向。原创 2024-04-02 17:56:34 · 1359 阅读 · 0 评论 -
kaggle竞赛宝典 | 最新时间序列统一大模型,秒杀各类时序任务!
今天给大家介绍一下哈佛和MIT最近联合发表的最新时间序列大模型工作,构建了一个统一的时间序列模型,能够处理各类时间序列任务,在38种不同的时间序列任务中,有27个都取得了最优效果。原创 2024-03-30 20:48:06 · 2606 阅读 · 0 评论 -
kaggle竞赛宝典 | Kaggle Optiver量化竞赛金牌网络方案分享(含代码!)
本文介绍在最新结束的Kaggle Optiver量化比赛中第七名的网络模型框架。第七名方案的网络框架主要是LSTM和ConvNet模型,其中包含了全局的股票统计特征以及偏离的特征用来加速收敛。原创 2024-04-05 18:22:54 · 757 阅读 · 0 评论 -
kaggle竞赛宝典 | 10大顶级开源大模型!
IT行业的历史告诉我们,开源是软件领域里的一大潮流,它推动了应用生态的繁荣。但自从GPT3出现后,Open AI却选择了闭源,这使得开源大模型的发展似乎停滞在了GPT3.5的阶段。不过,业界还是有一些不错的前沿开源大模型,比如Meta的LLaMA3、Mistral 8x7B和零一万物的Yi-34B等。原创 2024-05-26 11:15:19 · 1686 阅读 · 0 评论