![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文速递
文章平均质量分 90
数智笔记
目前从事数据挖掘工作,期望在自己学习总结的同时,也能分享有益的东西给别人,希望有志者能在数据挖掘领域共同进步
展开
-
2024年7月31日Arxiv机器学习相关论文
通过多模态学习(MML)结合携带互补信息的多种模态已经显示出在诊断多种病理方面具有相当大的好处。然而,多模态模型对缺失模态的鲁棒性经常被忽视。大多数研究假设输入数据中的模态完整性,而在临床实践中,模态不完整是很常见的。现有解决这一问题的方法依赖于在使用监督学习模型之前进行模态插补策略。然而,这些策略复杂、计算成本高,可能会严重影响后续的预测模型。因此,在诸如医疗保健等敏感应用中,它们应该被节制地使用。我们提出了HyperMM,这是一个专为学习具有不同大小输入而设计的端到端框架。原创 2024-07-31 22:11:40 · 206 阅读 · 0 评论 -
2024年7月31日Arxiv人工智能相关论文
原标题作者机构: 比勒菲尔德大学 AG 机器学习实验室摘要: 在最近的研究中,线搜索方法已被证明可以显著提升传统随机梯度下降技术在各种数据集和架构上的性能,同时使学习率调度这一原本关键的选择变得不那么重要。在本文中,我们识别了当前最先进的线搜索方法存在的问题,提出了改进方案,并严格评估了它们的有效性。此外,我们在比以往更大规模的数据集和更复杂的数据领域上评估了这些方法。更具体地说,我们通过加速计算和将动量项纳入Armijo准则,改进了Armijo线搜索方法,使其更适用于随机小批量处理。原创 2024-07-31 22:11:08 · 177 阅读 · 0 评论 -
2024年7月31日Arxiv语言模型相关论文
自动软件审查系统无法确定一篇帖子是支持还是反驳虚假言论,导致大量情境性假阳性。这限制了它们的有效性,例如通过在专家帖子上添加警告或诉诸模糊警告而不是细致的事实核查来破坏对健康专家的信任,从而使用户产生麻木感。在本文中,我们建议将立场检测纳入现有的自动软审查流程中,目的是排除情境性假阳性,并为应该接收警告的社交媒体内容提供更精确的建议。我们开发了一个名为对比文本偏差(CTD)的文本偏差任务,并展示了当应用于软审查时,它优于现有的立场检测方法。原创 2024-07-31 22:10:29 · 102 阅读 · 0 评论 -
2024年7月30日Arxiv机器学习相关论文
对于过参数化的优化任务,比如现代机器学习中发现的任务,全局最小值通常不是唯一的。为了理解在这些情境下的泛化能力,研究优化算法收敛到哪个最小值是至关重要的。在优化算法施加的动态下可能存在不稳定的最小值的可能性,这限制了算法可以找到的潜在最小值。在本文中,我们表征了对确定性梯度下降(SGD)和随机梯度下降(SGD)都是动态稳定/不稳定的全局最小值。原创 2024-07-30 19:35:49 · 157 阅读 · 0 评论 -
2024年7月30日Arxiv人工智能相关论文
人们普遍预期,人类终将创造出比我们聪明得多的人工智能系统,从而引发了“如何控制超智能”的未解决对齐问题。然而,这个定义不仅自相矛盾,而且可能无法解决。然而,解决这个问题的默认策略涉及培养(后训练)约束和道德价值观,同时不幸地在构建基础性质(预训练)时基于永久控制的记录意图。在本文中,通过推理论证了默认方法可预测地嵌入自然不信任,并呈现了表明这种危险不对齐的明显证据的测试结果。如果超智能不能本能地信任人类,那么我们就无法完全信任它可绕过的安全控制。原创 2024-07-30 19:35:14 · 231 阅读 · 0 评论 -
2024年7月30日Arxiv语言模型相关论文
原标题作者摘要: 在任何研究领域都有大量研究论文可供使用,这就需要自动摘要系统来呈现所进行研究的关键内容及相应的发现。科学论文摘要是一项具有挑战性的任务,原因包括现代Transformer模型中的Token长度限制,以及长文本所需的内存和计算需求。在这一领域已经进行了大量工作,其中一些方法修改了现有Transformer模型的注意机制,另一些利用话语信息来捕捉研究论文中的长距离依赖关系。在本文中,我们提出了一种研究论文摘要的混合方法,结合了抽取式和生成式方法。原创 2024-07-30 19:34:39 · 96 阅读 · 0 评论 -
2024年7月29日Arxiv语言模型相关论文
原标题作者机构: 佛罗里达国际大学摘要: 语言模型(LMs)在各种自然语言处理(NLP)任务中展现出了出色的性能。尽管取得了这些进展,LMs 可能会继承和放大与性别、种族等敏感属性相关的社会偏见,从而限制它们在现实应用中的采用。因此,公平性在 LM 中得到了广泛探讨,导致提出了各种公平性概念。然而,在特定背景下(例如,中型 LM 与大型 LM)应用哪种公平性定义尚无明确一致意见,而且理解这些定义之间的区别的复杂性可能会导致混淆,阻碍进一步的进展。原创 2024-07-29 16:50:47 · 473 阅读 · 0 评论 -
2024年7月29日Arxiv人工智能相关论文
本文提出了修复本体网络的框架,以解决传统调试技术在修复本体网络时可能会移除领域内正确后果的问题。该框架定义了调试、削弱和完成等基本操作。此外,它还定义了反映如何以及何时使用基本操作的组合运算符,以及关于本体网络中本体和对齐的自治级别的选择。我们展示了组合运算符对修复网络质量的影响,并提出了一个已实现的工具。通过将我们的框架与现有的调试、削弱和完成算法一起使用,我们基本上为扩展先前的工作和系统提供了一个蓝图。原创 2024-07-29 16:50:16 · 343 阅读 · 0 评论 -
2024年7月29日Arxiv机器学习相关论文
原标题作者机构: 帝国理工学院 牛津大学 索邦大学 Flatiron Institute摘要: 在推断问题中,我们经常拥有领域知识,这使我们能够定义捕捉数据集中大部分信息内容的摘要统计数据。在这篇论文中,我们提出了一种混合方法,其中基于物理的摘要统计数据被一组压缩的神经摘要统计数据所增强,这些神经摘要统计数据被优化以提取未被预定义摘要所捕获的额外信息。由此产生的统计数据是模型参数的基于模拟或隐式推断的非常强大的输入。原创 2024-07-29 16:49:37 · 230 阅读 · 0 评论 -
2024年7月26日Arxiv语言模型相关论文
最近出现的大语言模型(LLMs)标志着人工智能与人类互动的新时代。这些复杂的模型,如Chat-GPT及其后继者,展现出在语言理解方面的显著能力。然而,随着这些大语言模型的指数增长,一个仍然未被充分研究的关键维度是这些模型的个性化。诸如GPT-3等大型基础模型专注于创建一个为广泛任务和用户提供服务的通用模型。这种方法强调了模型的泛化能力,将用户视为一个集体而不是独立个体。虽然对于许多常见应用来说是实用的,但这种一刀切的方法通常无法解决人类多样性和个体需求的丰富多样性。原创 2024-07-26 18:21:41 · 279 阅读 · 0 评论 -
2024年7月26日Arxiv机器学习相关论文
原标题作者机构: 乌尔姆大学 大学埃塞克斯Universiy of Essex摘要: 由于建模信息的异质性以及随时间变化,对Web图进行总结是具有挑战性的。我们研究了神经网络在终身图总结中的应用。假设我们在某个时间观察到Web图,我们训练网络来总结图的顶点。然后,我们将这个训练好的网络应用于下一个时间点上已更改的图的顶点总结。随后,我们继续训练和评估网络以执行终身图总结。我们使用GNNs Graph-MLP和GraphSAINT,以及MLP基线来总结时间图。我们比较了1跳和2跳总结。原创 2024-07-26 18:20:50 · 347 阅读 · 0 评论 -
2024年7月26日Arxiv人工智能相关论文
传统的路线规划服务通常为所有驾驶员提供相同的路线,主要关注一些标准化因素,如行驶距离或时间,忽视了个体驾驶员的偏好。随着预计未来将出现自动驾驶车辆,这些车辆将依赖这些规划者决定的路线,有必要纳入每位驾驶员的具体偏好,确保个性化导航体验。在这项工作中,我们提出了一种基于图神经网络(GNNs)和深度强化学习(DRL)的新方法,旨在定制路线以适应个体偏好。通过分析个体驾驶员的历史轨迹,我们对其驾驶行为进行分类,并将其与相关道路属性联系起来,作为驾驶员偏好的指标。原创 2024-07-26 18:19:30 · 255 阅读 · 0 评论 -
2024年7月25日Arxiv机器学习相关论文
本文研究了多目标强化学习(MORL),重点是在存在多个奖励函数的情况下学习帕累托最优策略。尽管MORL在实证上取得了显著的成功,但对于各种MORL优化目标和高效学习算法仍然缺乏令人满意的理解。我们的工作对几个优化目标进行了系统分析,以评估它们找到所有帕累托最优策略的能力,并通过对不同目标的偏好来控制所学策略的可控性。然后,我们确定Tchebycheff标量化作为MORL的一种有利的标量化方法。考虑到Tchebycheff标量化的非光滑性,我们将其最小化问题重新制定为一个新的最小-最大-最大优化问题。原创 2024-07-25 19:03:59 · 598 阅读 · 0 评论 -
2024年7月25日Arxiv人工智能相关论文
自动推理是可解释人工智能(XAI)领域中一项关键技术,这是一个年轻但迅速发展的领域。可解释性有助于在人工智能系统中建立信任,超越它们仅仅的预测准确性和稳健性。在本文中,我们提出了一个科学发现循环,将机器学习与自动推理相结合,用于生成和选择解释。我们提出了一个解释选择问题的分类法,借鉴了社会学和认知科学的见解。这些选择标准包含了现有概念,并通过新属性进行了扩展。原创 2024-07-25 19:03:24 · 743 阅读 · 0 评论 -
2024年7月25日Arxiv语言模型相关论文
这篇论文并未介绍新颖的方法。相反,它在包括机器学习、计算机视觉、音频处理、自然语言处理和符号公式表示在内的各种任务中,提供了对KAN和MLP模型更公平、更全面的比较。具体来说,我们控制参数数量和FLOPs来比较KAN和MLP的性能。我们的主要观察是,除了符号公式表示任务外,MLP通常优于KAN。我们还对KAN进行消融研究,发现其在符号公式表示中的优势主要源于其B-spline激活函数。当B-spline应用于MLP时,在符号公式表示中的性能显著提高,超过或与KAN相匹配。原创 2024-07-25 19:02:40 · 849 阅读 · 0 评论 -
2024年7月24日Arxiv机器学习相关论文
这篇论文并未介绍新颖的方法。相反,它在包括机器学习、计算机视觉、音频处理、自然语言处理和符号公式表示在内的各种任务中,提供了对KAN和MLP模型更公平、更全面的比较。具体来说,我们控制参数数量和FLOPs来比较KAN和MLP的性能。我们的主要观察是,除了符号公式表示任务外,MLP通常优于KAN。我们还对KAN进行消融研究,发现其在符号公式表示中的优势主要源于其B-spline激活函数。当B-spline应用于MLP时,在符号公式表示中的性能显著提高,超过或与KAN相匹配。原创 2024-07-24 13:40:33 · 666 阅读 · 0 评论 -
2024年7月24日Arxiv人工智能相关论文
具身指令遵循(EIF)是一个任务,即根据高层自然语言指令规划一系列子目标,例如“冲洗一片生菜并放在白色桌子上,靠近叉子”。为了成功执行这些长期规划任务,我们认为智能体在每一步做决策时必须考虑其过去,即历史数据。然而,最近在EIF方面的方法经常忽略了来自历史数据的知识,也没有有效利用跨模态的信息。因此,我们提出了基于融合信息的历史感知规划(HAPFI),有效利用智能体在与环境互动时收集的来自不同模态的历史数据。原创 2024-07-24 13:40:00 · 915 阅读 · 0 评论 -
2024年7月24日Arxiv语言模型相关论文
多语言预训练对于转移学习显著提升了低资源单语音频识别模型的鲁棒性。本研究系统地调查了三个主要方面:(a) 转移学习对模型性能在初始训练或微调期间的影响,(b) 跨数据集领域和语言的转移学习影响,以及© 与非稀有词相比,对稀有词识别的影响。我们的发现表明,RNNT-loss 预训练,随后通过最小词错误率(MinWER)损失进行单语言微调,持续降低了意大利语和法语等语言的词错误率(WER)。相较于 MLS 和内部数据集的单语言基线,WER 降低率(WERR)分别达到了 36.2% 和 42.8%。原创 2024-07-24 13:39:29 · 518 阅读 · 0 评论 -
2024年7月23日Arxiv语言模型相关论文
原标题作者机构: 北京外国语大学 摩德纳和雷焦埃米利亚大学 东安格利亚大学摘要: 在书面话语分析中,一个强大而持久的观念是,体裁可以根据构成作者目的的举措来描述。大量研究试图确定这些独特的交际行为,但分析受到主观性、可靠性和需要多个编码者确认分析的耗时需求等问题的困扰。在本文中,我们利用GPT-4的优势,通过使用自然语言提示来自动化注释过程。我们专注于四本应用语言学期刊中的文章摘要,设计了能够使模型有效识别举措的提示。这些提示的注释输出由两名评估者评估,第三名评估者解决分歧。原创 2024-07-23 16:43:01 · 789 阅读 · 0 评论 -
2024年7月23日Arxi人工智能相关论文
在强化学习框架下制定一个现实世界的问题涉及到一些非平凡的设计选择,比如选择一个折现因子用于学习目标(折现累积奖励),这个因子表达了智能体的规划视野。本研究调查了折现因子对偏差-方差权衡的影响,考虑了底层马尔可夫决策过程的结构参数。我们的结果支持一个更短的规划视野可能是有益的,尤其是在部分可观测性下。原创 2024-07-23 16:42:26 · 439 阅读 · 0 评论 -
2024年7月23日Arxiv机器学习相关论文
我们研究了在对手可能添加任意异常值时估计明显分离混合物的均值的问题。当异常值的比例明显小于最小混合权重时,可以提供强有力的保证,但当异常值可能排挤低权重聚类时,我们了解的情况就少得多 - 这是我们称之为列表可解混合学习(LD-ML)的设置。在这种情况下,对手的异常值可以模拟额外的虚假混合组件。因此,如果必须在输出列表中将混合物的所有均值恢复到小误差以内,则列表大小需要大于(真实)组件的数量。原创 2024-07-23 16:41:48 · 508 阅读 · 0 评论 -
2024年7月22日Arxiv机器学习相关论文
深度神经网络(DNNs)通过从大规模数据集中学习复杂的非线性映射,在各个领域取得了卓越的性能。然而,它们面临诸如高计算成本和有限的可解释性等挑战。为了解决这些问题,将物理与人工智能相结合的混合方法备受关注。本文介绍了一种名为“非线性薛定谔网络”的新型基于物理的人工智能模型,将非线性薛定谔方程(NLSE)视为用于从数据中学习包括非线性映射和记忆效应在内的复杂模式的通用可训练模型。现有的基于物理的机器学习方法使用神经网络来近似求解偏微分方程(PDEs)的解。原创 2024-07-22 22:12:36 · 888 阅读 · 0 评论 -
2024年7月22日Arxiv人工智能相关论文
在这篇论文中,我们研究了隐式深度学习模型在处理未观测数据时的外推能力,传统深度神经网络可能会失败。隐式模型以其在层深度上的适应性和在计算图中引入反馈的特点而脱颖而出,在各种外推场景中进行了测试:分布之外、地理和时间转移。我们的实验始终表明隐式模型具有显著的性能优势。与非隐式对应物不同,后者通常依赖于每个任务的细致架构设计,隐式模型展示了学习复杂模型结构的能力,无需特定于任务的设计,突显了它们在处理未见数据时的稳健性。原创 2024-07-22 22:10:57 · 502 阅读 · 0 评论 -
2024年7月22日Arxiv语言模型相关论文
原标题作者机构: 皇家墨尔本理工大学 新加坡南洋理工大学摘要: 关键点分析(KPA)旨在定量总结,提供关键点(KPs)作为简明的文本摘要,并量化它们的普遍性。文献中已经报道了关于论点和评论的KPA研究。大多数评论的KPA研究采用监督学习来提取短句作为KPs,然后将KPs与评论进行匹配,以量化KP的普遍性。最近的抽象方法仍然基于句子生成KPs,通常导致KPs存在重叠和虚构的观点,以及不准确的量化。在本文中,我们提出了用于定量评论总结的提示性方面关键点分析(PAKPA)。原创 2024-07-22 22:10:15 · 648 阅读 · 0 评论 -
2024年7月19日Arxiv机器学习相关论文
在深度强化学习的实际成功中,高效地探索高维状态空间的能力至关重要。本文介绍了一种名为随机潜在探索(RLE)的新探索技术,它结合了基于奖励和基于噪声的两种流行的深度强化学习中有效探索的策略的优势。RLE利用了在环境的某些(随机)状态下通过向原始任务奖励添加结构化随机奖励来扰动奖励的想法,以鼓励智能体在训练过程中探索环境。RLE易于实现,并在实践中表现良好。原创 2024-07-19 13:05:27 · 622 阅读 · 0 评论 -
2024年7月19日Arxiv人工智能相关论文
推荐系统(RS)通过提供个性化的物品建议,对增强用户体验起着至关重要的作用。本调查全面审视了从2017年到2024年的RS进展,有效地将理论进展与实际应用联系起来。我们探讨了从传统的RS技术(如基于内容和协同过滤)到涉及深度学习、基于图的模型、强化学习和大语言模型等先进方法的发展。我们还讨论了诸如上下文感知、基于评论、以及关注公平性的专门系统。本调查的主要目标是搭建理论与实践之间的桥梁。它解决了各个领域的挑战,包括电子商务、医疗保健和金融,强调了可扩展、实时和值得信赖解决方案的需求。原创 2024-07-19 13:04:53 · 540 阅读 · 0 评论 -
2024年7月19日Arxiv语言模型相关论文
原标题作者机构: 南卡罗来纳大学摘要: 文本摘要是一个经过深入研究的问题,涉及从人类消耗的非结构化文本中获取见解,并已在广泛的商业应用中找到应用。然而,许多现实生活任务涉及生成一系列行动以实现特定目标,例如工作流程、食谱、对话和旅行计划。我们将它们称为类似规划(PL)任务,指出它们共享的主要共同点是控制流信息,这些信息可能部分指定。它们的结构提供了一个机会,可以创建更实用的摘要,帮助用户快速做出决策。我们通过引入一个新颖的计划摘要问题、提供一个数据集,并提供一个用于生成PL摘要的基线方法来研究这一观察。原创 2024-07-19 13:04:22 · 754 阅读 · 0 评论 -
2024年7月18日Arxiv语言模型相关论文
原标题作者机构: 摩拉图瓦大学 工程学院 斯里兰卡 意识人工智能摘要: 在快速发展的数字时代,随着个人试图从各种信息源中提炼关键见解,对简洁信息的需求日益增加。研究人员近期对多文档摘要(MDS)的关注导致了涵盖客户评论、学术论文、医疗和法律文件以及新闻文章的多样化数据集的出现。然而,这些数据集以英语为中心的特性在当今全球化数字化领域中造成了明显的多语种数据集空白,而在这里语言多样性受到推崇。诸如英国广播公司(BBC)等媒体平台几十年来以20多种语言传播新闻。原创 2024-07-18 18:37:02 · 806 阅读 · 0 评论 -
2024年7月18日Arxiv人工智能相关论文
学习线性结构因果模型的未知因果参数是因果分析中的一个基本任务。这个被称为识别问题的任务要求从模型的图形结构和观测数据(表示为非因果协方差矩阵)的组合中估计模型的参数。在本文中,我们提出了一个在多项式空间内运行的通用识别算法。通过标准模拟结果,这个算法具有指数级的运行时间,大大改进了使用 Gröbner 基础方法的现有双指数时间方法。本文还提供了证据表明参数识别在一般情况下是计算困难的。特别地,我们证明,对于给定的可行相关矩阵,询问是否有恰好一个或两个或更多参数集解释观察到的矩阵的任务对于。原创 2024-07-18 18:36:18 · 591 阅读 · 0 评论 -
2024年7月18日Arxiv机器学习相关论文
大语言模型智能体在各种应用中展示出卓越的性能,主要是因为它们在推理、利用外部知识和工具、调用 API 以及执行与环境交互的操作方面具有先进的能力。当前的智能体通常利用记忆模块或检索增强生成(RAG)机制,从知识库中检索过去的知识和具有相似嵌入的实例,以指导任务规划和执行。然而,对未经验证的知识库的依赖引发了对它们安全性和可信度的重大关注。原创 2024-07-18 18:35:42 · 500 阅读 · 0 评论 -
2024年7月17日Arxiv机器学习相关论文
原标题作者机构: 清华大学 剑桥大学摘要: 获取细粒度需求数据对于实现零净排放转型至关重要;随着我们对可变可再生能源的依赖增加,它可以实现准确的用户画像和主动需求管理。然而,由于隐私问题,这些数据的公开发布通常是不可能的。优质的合成数据可以绕过这一问题。尽管在生成合成智能电表数据方面进行了大量研究,但在创建一致的评估框架方面仍然存在不足。在本文中,我们研究了其他行业常用的共同框架如何应用于合成智能电表数据,例如保真度、实用性和隐私性。原创 2024-07-17 11:25:01 · 818 阅读 · 0 评论 -
2024年7月17日Arxiv人工智能相关论文
原标题作者机构: 悉尼大学 AWS AI实验室 韩国科学技术院摘要: 上下文化图像字幕(CIC)将传统图像字幕发展到一个更复杂的领域,需要多模态推理的能力。它旨在在给定特定上下文信息的情况下生成图像字幕。本文进一步介绍了一个新颖的可控上下文化图像字幕(Ctrl-CIC)领域。与仅依赖于广泛上下文的CIC不同,Ctrl-CIC强调用户定义的亮点,迫使模型定制与上下文中突出部分 resonating 的字幕。原创 2024-07-17 11:24:28 · 645 阅读 · 0 评论 -
2024年7月17日Arxiv语言模型相关论文
原标题作者机构: 哥廷根大学 德国 Göttingen Georg-August-Universität摘要: 会议摘要已成为一项关键任务,因为数字会议已成为常见做法。大语言模型(LLMs)在摘要中展现出巨大潜力,相较于传统方法,它们提供了更强的连贯性和上下文理解能力。然而,它们仍然难以保持相关性并避免产生幻觉。我们引入了一种多LLM校正方法,用于会议摘要,采用了一个模拟人类审阅过程的两阶段流程:错误识别和摘要优化。原创 2024-07-17 11:23:42 · 783 阅读 · 0 评论 -
2024年7月16日Arxiv语言模型相关论文
原标题作者机构: 浙江大学 腾讯摘要: 查询焦点摘要(QFS)旨在生成回答特定感兴趣问题的摘要,实现更大的用户控制和个性化。随着大型语言模型(LLMs)的出现,展示了它们通过大规模预训练对文本理解的令人印象深刻的能力,这意味着抽取式片段生成的巨大潜力。在本文中,我们系统地研究了基于LLMs的QFS模型应该利用的两个不可或缺的特征,分别是长篇文档摘要和高效的细粒度查询-LLM对齐。原创 2024-07-16 18:43:40 · 537 阅读 · 0 评论 -
2024年7月16日Arxiv人工智能相关论文
原标题作者机构: 微软Azure摘要: 随着对大语言模型(LLMs)易于被盗用和滥用的担忧日益增长,对模型进行指纹识别的需求也在增加。在这种情况下,指纹识别意味着模型所有者可以将给定模型与其原始版本关联起来,从而确定其模型是否被滥用或完全被盗用。在本文中,我们首先定义了一组成功指纹应满足的五个属性;即,指纹应该是透明的、高效的、持久的、强大的和不可伪造的。接下来,我们提出了Chain & Hash,一种新的简单的指纹识别方法,它实现了一种带有密码学风格的指纹,实现了所有这些属性。原创 2024-07-16 18:43:04 · 927 阅读 · 0 评论 -
2024年7月16日Arxiv机器学习相关论文
贝叶斯逆强化学习(IRL)的目标是使用专家的一组演示来恢复奖励函数的后验分布,该专家针对学习者未知的奖励进行优化。然后,得到的奖励后验可以用来合成一个学徒策略,该策略在相同或类似任务上表现良好。贝叶斯IRL面临的一个关键挑战是弥合可能奖励的假设空间和通常以Q值定义的似然之间的计算差距:传统的贝叶斯IRL需要在算法的每一步解决昂贵的前向规划问题 - 从奖励到Q值 - 这可能需要进行成千上万次。原创 2024-07-16 18:42:14 · 739 阅读 · 0 评论 -
2024年7月15日Arxiv机器学习相关论文
欧几里得几何的持久遗产支撑着经典机器学习,几十年来,它主要是为了处理存在于欧几里得空间中的数据而发展的。然而,现代机器学习越来越多地遇到具有丰富结构的本质上非欧几里得的数据。这些数据可能展现出复杂的几何、拓扑和代数结构:从时空曲率的几何到大脑神经元之间的拓扑复杂交互,再到描述物理系统对称性的代数变换。从这样的非欧几里得数据中提取知识需要更广泛的数学视角。回应19世纪引发非欧几里得几何的革命,一条新兴的研究路线正在重新定义具有非欧几里得结构的现代机器学习。原创 2024-07-15 18:49:34 · 524 阅读 · 0 评论 -
2024年7月15日Arxiv人工智能相关论文
原标题作者机构摘要: 海运业正在迅速发展,这得益于计算机视觉人工智能(AI)的进步。因此,针对海上运输的基于AI的物体识别模型的研究正在稳步增长,利用了传感器技术和计算性能的进步。然而,在海上环境中进行物体识别面临诸如光反射、干扰、强烈光照和各种天气条件等挑战。为了解决这些挑战,针对海上图像的高性能深度学习算法以及专门针对海上场景的高质量数据集至关重要。现有的AI识别模型和数据集对于构建自主导航系统的适用性有限。原创 2024-07-15 18:48:57 · 506 阅读 · 0 评论 -
2024年7月15日Arxiv语言模型相关论文
大语言模型(LLMs)的出现彻底改变了用户访问信息的方式,从传统的搜索引擎转变为直接与LLMs进行问答交互。然而,LLMs的广泛应用揭示了一个重大挑战,即所谓的“幻觉”,即LLMs生成连贯但事实不准确的回答。这种幻觉现象导致用户对基于LLMs的信息检索系统的不信任。为了解决这一挑战,本文提出了基于幻觉检测的动态检索增强(DRAD)作为一种新颖的方法,用于检测和减轻LLMs中的幻觉。DRAD通过根据实时幻觉检测动态调整检索过程,改进了传统的检索增强方法。原创 2024-07-15 18:48:19 · 566 阅读 · 0 评论 -
2024年7月12日Arxiv机器学习相关论文
从概率密度中抽样的任务可以被看作是将一个可处理的密度函数传输到目标密度的过程,这被称为动态测度传输。在这项工作中,我们通过一个基于确定性或随机演化的原则统一框架来解决这个问题,这些演化由偏微分方程(PDEs)描述。这个框架融合了先前基于轨迹的抽样方法,比如扩散模型或薛定谔桥,而无需依赖时间逆转的概念。此外,它使我们能够提出新颖的数值方法来解决传输任务,从而从复杂的目标中抽样,而无需归一化常数或数据样本。我们利用物理信息神经网络(PINNs)来近似相应的PDE解,这意味着在概念和计算上都具有优势。原创 2024-07-12 13:22:24 · 1084 阅读 · 0 评论