
论文速递
文章平均质量分 92
深度人工智能
工业和信息化职业能力证书《人工智能算法工程师》报名考试,普通人进入人工智能行业的最佳途径,有意者私信!
展开
-
目标检测技术的发展:从R-CNN、YOLO到DETR、DINO
OV-DINO的出现标志着在开放域目标检测领域的重大进步,其在处理未见过的物体类别时的能力得到了显著提升。这项技术对于需要适应未知或变化环境的应用具有重要意义,如自动驾驶、机器人视觉、安防监控等。原创 2024-09-30 16:33:15 · 1863 阅读 · 0 评论 -
神经网络新范式——LNDP:可终身学习的自主发育程序
LNDP使得人工神经网络能够以活动和奖励依赖的方式实现突触和结构的可塑性,并桥接了间接发育编码(indirect developmental encoding)和元学习的可塑性规则,并提出了Evolving Self-Assembling Neural Networks(进化自组装网络)。这意味着神经网络终于可以根据具体任务进行自主连接和生长发育了,而非以往固定的、静态的、完全连接的方式。原创 2024-07-24 16:38:39 · 1634 阅读 · 2 评论 -
大模型基础架构的变革:剖析Transformer的挑战者(下)
目前业内对将LLM应用于长文本进行了广泛的研究,主要关注三个领域:长度外推、上下文窗口扩展,以及提高LLM对长文本的利用。.长度外推的目的是使在较短文本上训练的语言模型能够在测试过程中处理较长的文本。一个主要的研究途径是开发Transformer模型的相对位置编码方法,使它们能够在训练窗口之外发挥作用。上下文窗口扩展集中于扩展LLM的上下文窗口,允许在一次向前传递中处理更多的token。一个主要的工作方向是解决训练效率的问题。考虑到Transformer在训练过程中存在对注意力计算随token增长的原创 2024-02-09 17:33:31 · 1291 阅读 · 0 评论 -
大模型基础架构的变革:剖析Transformer的挑战者(中)
上一篇文章中,我们介绍了RetNet、RWKV、Mamba等有可能会替代Transformer的模型架构,这一篇文章我们将要介绍另外三个有可能会替代Transformer的模型架构,它们分别是UniRepLKNet、StripedHyena、PanGu-π,想了解之前的内容,请前往《》一文查阅。原创 2024-02-01 11:53:00 · 1556 阅读 · 0 评论 -
大模型的研究新方向:混合专家模型(MoE)
混合专家模型的实现涉及对专家模型和门控网络的联合训练,在整个数据输入处理的过程中,门控网络起到了动态调配专家模型资源的关键作用,使混合专家模型能够灵活地适应不同的输入数据分布和任务要求。说到这里的“门”概念,与LSTM网络的“门”概念有所不同,MoE的“门”概念主要是用于匹配数据和专家模型之间的连接,就好比不同班级的学生要进不同的教室上课一样,而LSTM的“门”概念主要是一种控制信息流动的装置,它可以保留或通过一定比例的数据,更像是在控制流量,而MoE的“门”概念可以看作是选择要通过的对象。原创 2023-12-13 15:42:13 · 2162 阅读 · 0 评论 -
【论文解读】:大模型免微调的上下文对齐方法
具体来说,通过分析基础LLMs和alignment-tuned版本在令牌分布上的差异,作者发现在大多数情况下,它们在解码上表现几乎相同,主要的变化发生在文体方面,如话语标记和安全声明。通过URIAL的成功应用,作者提出了一个引人深思的观点,即通过巧妙的提示和上下文学习,可以显著减小无调整和基于调整的alignment方法之间的差距。这暗示在SFT过程中,令人瞩目的是,在强基础LLMs(如Mistral-7b和Llama-2-70b)上,URIAL的性能优于经过SFT或SFT+RLHF对齐的LLMs。原创 2023-12-07 18:39:25 · 1404 阅读 · 0 评论 -
【论文速递】:老驾驶员轨迹数据中的异常行为检测
在本文中,我们提出了一种边缘属性矩阵,该矩阵可以表示时间详细的轨迹数据集的关键属性并识别异常驾驶行为。本文涉及的问题是在给定道路网络和一组轨迹数据的情况下,如何检测驾驶员在行程中表现出的显著方向偏差、急刹车和急加速等异常行为。在问题的定义中,作者将一次行程表示为一个有向图,节点代表道路网络上的空间位置,边代表道路段,每条边都有时间详细的驾驶属性。工信部教考中心的人工智能算法工程师,人社部的人工智能训练师,中国人工智能学会的计算机视觉工程师、自然语言处理工程师的课程培训,以及证书报名和考试服务。原创 2023-11-30 14:36:05 · 1078 阅读 · 0 评论