- 博客(44)
- 收藏
- 关注
原创 高效涨点神器!自适应特征融合分分钟发A会
然而,这些模型的泛化能力可能会受到其特征融合技术的局限性的负面影响。RT-DETR设计:提出了Real-Time DEtection TRansformer(RT-DETR),这是一种端到端的目标检测器,通过两步构建,首先关注在保持准确性的同时提高速度,然后是在保持速度的同时提高准确性。自适应特征融合(AFF)解码器:通过融合不同尺度的特征图来捕获多尺度局部和全局信息,最大化窗口注意力的协同潜力,性能提升显著,例如在ISICDM2019数据集上DSC达到96.75%,mIoU达到96.04%。
2025-01-09 10:36:46
1637
原创 能发顶会!图神经网络(GNN)创新方案整理
GNN的核心思想是利用图中的节点和边之间的关系,通过消息传递和节点更新的方式,来捕捉图的局部结构和全局拓扑特征,进而提取更丰富的特征表示。TFE-GNN模型:提出TFE-GNN模型,分别处理数据包头部和载荷,并将每个字节级流量图编码为每个包的整体表示向量,实验结果表明TFE-GNN在多个数据集上的性能优于现有方法,例如在Telegram数据集上F1分数提高了10.82%,在ISCX-Tor数据集上提高了4.58%。字节级流量图:首次构建字节级流量图,从不同角度支持流量分类,提升了分类的细粒度。
2024-12-31 10:45:42
1820
原创 小目标检测性能UP!新成果刷爆SOTA
不过在近几年间,已经有许多有效的解决方法被提出。性能提升:在MS-COCO和Pascal VOC基准测试中,Sparse Semi-DETR实现了对当前最先进方法的显著改进,例如在MS-COCO上使用ResNet-50作为骨干网络,仅使用10%的标记数据就达到了44.3 mAP,比之前的基线提高了0.8 mAP。查询精炼模块(Query Refinement Module):通过融合来自背景的低级特征和从弱增强图像中提取的高级特征,增强了对象查询的质量,显著提高了对小目标和部分遮挡目标的检测能力。
2024-12-30 11:04:01
1632
原创 Nature+Science=ONNs(光学神经网络)
这项研究的核心是全前向智能光计算训练架构,以及“太极-II”光训练芯片的研制,这使得大规模神经网络的高效精准训练成为可能,同时摆脱了原有光计算系统对GPU离线建模的依赖。前向训练:实验展示了这种完全集成的相干光学神经网络架构,用于具有六个神经元和三层的深度神经网络,能够以410皮秒的延迟光学计算线性和非线性函数。原位反向传播:实验性地训练了一个三层四端口的硅光子神经网络,使用“原位反向传播”方法,通过光干涉测量前向和反向传播光的相位偏移电压梯度。
2024-12-27 10:44:23
2150
原创 超越传统卷积!快速傅里叶卷积(Fast Fourier Convolution)新突破
性能提升:在真实世界和合成的夜间眩光去除数据集上,FF-Former的PSNR和SSIM指标分别提升了0.37 dB和0.41 dB,优于现有最先进方法。低频和高频分支:将FFC分为两个主要分支,一个与低通滤波器级联,另一个与高通滤波器级联,以实验发现颜色主要集中在低频部分,而轮廓和边缘在高频部分。快速傅里叶卷积(FFC):提出了一种新的着色网络,使用快速傅里叶卷积(FFC),能够有效地连接图像中的两个远距离位置,并具有全局感受野。
2024-12-26 10:33:19
1560
原创 双热点结合!GNN+强化学习 刷爆SOTA
性能提升:在Cyber Autonomy Gym for Experimentation (CAGE 2)环境中验证了方法的有效性,展示了代理在未训练过的网络变体上的性能提升。性能提升:在多个图和节点级任务中验证了方法的有效性,显示出比微调和其他基于提示的方法更好的分类性能和数据效率,平均提升1.64%。性能提升:在成都和纽约的真实城市数据上验证了框架的性能,展示了策略的零样本转移能力,与控制方法相比,性能提升接近最优。新的图表示方法:提出了一种新的图表示方法,适用于所有CSP实例,无需特定问题的图简化。
2024-12-25 11:30:09
1533
原创 扩散模型+时间序列!这个创新思路必将爆发
性能提升:在多个基准数据集和预测场景上的实验表明,观察自引导与任务特定的条件基线具有竞争力,CRPS值平均降低了15%。无条件训练的扩散模型TSDiff:提出了一种无条件训练的扩散模型TSDiff,用于时间序列。光栅掩蔽策略:通过光栅掩蔽策略,增强了正常和异常数据之间的决策边界,提高了异常检测的准确性。粗粒度数据的有效利用:通过利用不同粒度级别的粗粒度数据实例,提高了模型的预测性能。无条件扩散模型的应用:首次将无条件扩散模型应用于时间序列预测,无需额外的临床注释。
2024-12-24 11:11:54
2647
原创 时间序列的可解释性丨最新成果+源码分享
Diffusion-TS框架:提出了一种时间序列生成框架Diffusion-TS,结合季节-趋势分解技术和去噪扩散模型,通过傅里叶基训练目标和深度分解架构的嵌入,使框架成为一种高效且可解释的通用时间序列生成解决方案。自监督基学习:首次提出了一种自监督方法来学习基,通过将时间序列的历史和未来部分视为两个不同的视图,并采用对比学习,确保时间序列选择的基在两个视图中保持一致。评估方法和指标:提出了一个新的评估方法和一组评估指标,用于事后可解释性,以回答哪种方法产生的可解释性图更接近神经网络实际用于做出预测的图。
2024-12-23 10:56:38
1044
原创 发文热潮思路 LLM大模型x知识图谱
性能提升:在GPT-2 XL和GPT-J上的实验表明,GLAME显著提高了编辑后大型语言模型在使用编辑知识方面的泛化能力,特别是在多跳推理中,Portability Score分别提高了11.76%和10.98%。自主迭代机制:开发了一个基于工具选择和记忆更新的自主迭代机制,集成了微调的LLM、多功能工具箱、基于知识图谱的执行器和知识记忆,用于自主推理。知识图谱整合:将知识图谱整合到模型编辑中,提出了一种新颖有效的编辑方法,以结构化的方式整合编辑引起的知识变化。
2024-12-20 11:18:14
773
原创 登上Science!对比学习(Contrastive Learning)疯狂收割顶会顶刊
美国伊利诺伊大学香槟分校、康奈尔大学和佐治亚理工学院的研究团队合作开发了一种名为CLEAN(Contrastive Learning enabled Enzyme Annotation,即“启用对比学习的酶注释”)的机器学习算法,该算法能够对未经研究的酶类实现准确、可靠且高灵敏度的酶功能预测。对比学习的核心思想是,相似的样本应该在表示空间中更接近,而不相似的样本应该更远离。增强的对比学习:通过引入双宇宙,显著提高了对比学习的效果,尤其是在处理时间序列数据的复杂性时,能够更有效地捕获有用的特征。
2024-12-19 10:33:19
1758
原创 曼巴+遥感创新性结合,暴力涨点,好发不卷!
性能提升:实验验证了RSCaMa模型的有效性,特别是在关键指标如BLEU-4和S∗m上表现出色,与最新PromptCC模型相比,BLEU-4提升1.70%,S∗m提升1.11%。性能提升:在两个城市(北京和西安)的实验中,UV-Mamba模型的性能超过了最先进的CNN和Transformer模型,分别在IoU上提升了1.2%和3.4%。全局特征捕获:RSMamba通过状态空间模型捕获整个图像的全局依赖关系,提供了更精确的语义线索,增强了场景判别的能力。
2024-12-18 11:10:18
1654
原创 创新性融合丨卡尔曼滤波+目标检测 新突破!
性能提升:BoT-SORT在MOT17和MOT20数据集上实现了80.5的MOTA、80.2的IDF1和65.0的HOTA,显著优于其他跟踪器。在目标检测中,卡尔曼滤波可以用于预测目标下一时刻的位置和速度,然后利用观测数据(如摄像头捕获的图像)来校正预测,从而提高目标跟踪的准确性。IoU和ReID融合:开发了一种新的方法,用于结合IoU距离矩阵和余弦距离矩阵,以实现检测和轨迹之间更稳健的关联。关联方法创新:通过IoU和ReID的融合,实现了更稳健的检测和轨迹关联,提高了跟踪的准确性。
2024-12-17 11:24:27
2173
原创 LSTM又火了!CNN+LSTM+Attention=刷爆SOTA
比如在短期负荷预测(STLF)中,有研究首次采用LSTM-CNN结合的自注意力机制(SAM)模型,通过仅使用负荷数据,实现一种基于输出维度的混合预测框架,并使用卷积核来提取用户的随机性,解决非平稳特性问题。CLA模型性能提升:与传统的LSTM和CNN-LSTM模型相比,CLA模型在根区土壤湿度预测方面的性能显著提升,特别是在80-100 cm深度,R²值接近0.9298,RMSE降低了49%和57%。CNN特征提取:引入CNN来捕获特征的动态变化,降低了非线性模型的数据复杂性,从而减少了不确定性的影响。
2024-12-16 10:58:41
1358
原创 Attention+UNet!完美应用医学图像分割
性能提升:在DRIVE和CHASE_DB1数据集上,SA-UNet实现了最先进的性能,特别是在小血管交叉点的分割性能上优于AG-Net。注意力机制的集成:注意力机制的集成使模型能够专注于对RFI检测至关重要的特征,而不是处理特征图中的所有信息,从而提高了检测效率。EMSCA-UNet模型:提出了一种新的深度学习模型EMSCA-UNet,用于RFI检测,结合了多尺度卷积和注意力机制的优势。集成到U-Net模型:将注意力门集成到标准的U-Net模型中,以最小的计算开销提高模型的敏感性和预测准确性。
2024-12-13 11:46:17
1355
原创 Attention+可变形卷积 =拿下2024顶会!
另一种实现是在医学图像分割中,引入了可变形大核注意力(D-LKA Attention)发了一篇医学分割的WACV2024,这是一种简化的注意力机制,采用大卷积核以充分利用体积上下文信息,并通过可变形卷积灵活变形采样网格,使模型能够适应多样的数据模式。计算效率:D-LKA Net在保持性能的同时,参数数量只有42.35M,而计算量为66.96G,相较于SOTA方法如Swin-UNETR和nnFormer,只需要约17%和31%的计算量,同时实现了更好的性能。
2024-12-12 10:16:26
1291
1
原创 结合多模态“杀”穿Transformer!CNN:卷积一生,不弱于人!
此外,为了防止过拟合和提高模型的泛化能力,还可以采用数据增强、正则化等策略。大核ConvNets的潜力展示:不仅在原始领域标志着ConvNet的“回归”,还展示了大核ConvNet在新领域“征服”的潜力,扩大了其在各种任务中的适用性和多功能性。模型性能提升:通过特定的模态相关预处理方法,提出的模型在时间序列预测和音频识别任务上实现了最先进的性能,即使没有针对特定模态的架构定制。性能提升:与现有最先进的方法相比,在等错误率(EER)上实现了超过20%的相对改进,在平均精度(AP)上实现了超过7%的相对改进。
2024-12-11 11:51:55
1531
原创 Mamba+Transformer,可实现超Transformer5倍吞吐量!
Mamba-Transformer专家模型:提出了一个多尺度混合Mamba-Transformer专家模型(SST),通过结合Mamba和Local Window Transformer(LWT)来分别处理长时序的全局模式和短时序的局部变化。综合性能提升:在多个领域和任务中,SSMs展现出与Transformer竞争的性能,特别是在语言领域任务中,SSMs在标准回归上下文学习(ICL)任务中表现出色,与Transformer相比,在稀疏奇偶性学习任务中表现更优。
2024-12-10 10:55:51
2373
原创 性能再升级!损失函数+注意力机制一举拿下高分
在多个基准数据库上的实验结果表明,所提出的注意力机制是一个通用、有效和高效的框架,与其他最先进的MIL方法相比,可以取得更好的袋子和图像分类性能,并且获得比以前的注意力机制更高的实例精度和召回率。类不平衡处理:提出的加权变体的focal loss在处理不平衡类别的同时,专注于难分类的样本,一致性地提高了性能。基于小波的损失函数:通过结合多个损失函数与离散小波变换(DWT),增强了损失函数的有效性,特别是在高频细节上的损失信息,这些细节通常对应于深度图中的物体边缘和角落,对于细粒度估计非常有用。
2024-12-09 15:58:54
1342
原创 顶会新宠!KAN-LSTM完美融合新方案
时间序列预测的创新:通过在LSTM架构中用XNet替换传统的前馈神经网络(FNN),引入了XLSTM模型,在时间序列预测实验中,XLSTM在准确性和可靠性方面一致超越了传统的LSTM模型。性能提升:在多步预测任务中,TKAN相比于传统的LSTM和GRU模型表现出更好的性能,例如在15步预测中,TKAN的R-squared值比GRU高出至少25%,显示出在长期预测中的优势。结合KAN和LSTM:TKAN结合了KAN和LSTM的优点,提升了多步时间序列预测的准确性和效率,特别是在处理复杂序列模式方面。
2024-12-06 11:20:00
2210
原创 Mamba 架构+医学图像分割 25年必将迎来新爆发!
比如Mamba-UNet是一种新颖的架构,它结合了U-Net和曼巴的能力。与nnU-Net相比,LightM-UNet在参数数量上减少了116倍,在计算成本上减少了21倍,同时在LiTS数据集上平均mIoU提升了3.45%(从nnU-Net的74.13%提升到LightM-UNet的77.48%)。通过使用大核Mamba,LKM-UNet在3D腹部CT数据集上DSC提升了0.44%(从U-Mamba的86.38%提升到LKM-UNet的86.82%),显示了大接受场对医学图像分割的重要性。
2024-12-05 10:43:35
2079
原创 PINN新风向!结合频域,好发不卷上Nature!
在各种动态点载荷(包括单频谐波载荷、多频谐波负载、多频随机负载)的求解中,PINNFD方法表现出了优越性,特别是在多频随机载荷下的问题求解中,相较于传统PINN方法,PINNFD取得了更好的结果。傅里叶PINNs在保持计算效率的同时,只需要指定足够大的范围和小的间距,无需关心真实解中实际的频率数量和规模,从而减少了对用户指定超参数的依赖。通过硬约束的方式修改频率域波场的表示,以固有地满足边界条件(地表上的测量数据),避免了在PINNs中平衡数据和PDE损失的困难。
2024-12-04 10:36:55
3660
2
原创 又登Nature!小波变换+注意力机制 取得革命性进展
注意力机制被用来增强模型对输入数据中某些部分的关注度,从而提高模型的性能和解释性。通过在小波域中同时处理内容增强、城市风格解耦和雾风格解耦,显著提高了模型对未见过的雾场景的泛化能力,性能提升具体表现为在 Foggy Zurich 数据集上提高了11.8% mIoU,在 ACDC-fog 数据集上提高了16.7% mIoU。通过在小波域中同时利用注意力和流的优势,实现了更好的特征融合,从而在DeepFashion数据集上实现了新的最先进性能,具体表现为FID和LPIPS分别提高了4.97%和3.89%。
2024-12-03 10:43:30
2967
原创 左手Nature,右手顶会!时空预测才是天降紫微星
通过拟合相对较少的观测值,为训练数据集之外的时间序列获得节点嵌入,比微调全局模型更具有效性,例如,在PEMS数据集上,使用节点嵌入的模型在目标数据集上的平均绝对误差(MAE)为15.45,相比全局模型的15.90有所降低。提供有效的正则化,允许时间序列之间的相似性显现,并阐明全局架构中局部嵌入的作用,例如,在CER-E数据集上,通过聚类正则化方法,不同簇的用户显示出明显不同的消费模式。首次将Mamba模型引入基于视觉的时空预测,以利用其强大的序列建模能力,提升了模型在处理长序列数据时的效率和准确性。
2024-12-02 18:35:21
1205
原创 结合创新!transformer+特征融合新突破
Transformer和特征融合的结合是一种在计算机视觉领域中非常活跃的研究领域,它旨在通过结合Transformer的自注意力机制和特征融合技术来提高模型的性能、降低计算成本以及提升模型泛化能力。在红外-可见光多光谱数据集上,与最先进的方法相比,提出的方法在目标检测性能上取得了显著提升,例如在LLVIP数据集上mAP提高了4.9%,在FLIR-aligned数据集上mAP提高了9.1%。提出的模型是通用的,能够快速实现在大多数单模态基于变换器的检测器上,这增加了模型的适用性和灵活性。
2024-11-29 11:16:09
1100
原创 搜索新革命!多模态检索上大分,好发不卷
在 PlantWild 数据集上,Snap’n Diagnose 方法在所有评估指标上均优于 Zero-shot CLIP,Top-1 准确率提升了 67.32%,Top-5 准确率提升了 80.65%,mAP 提升到 79.34%。传统的信息检索通常基于文本数据,而多模态数据检索则扩展到了其他媒体模态,使用户能够以更丰富的方式进行查询和检索。在Encyclopedic-VQA测试集上,使用外部知识源的模型准确率从16.3%提高到34.7%,在InfoSeek验证集上,准确率从12.3%提高到36.9%。
2024-11-28 10:40:59
818
原创 Nature收割机!多尺度特征融合简直“杀”疯了
例如,一种网络通过多尺度的注意力特征融合来处理复杂的任务。通过使用预训练的血管掩码作为先验知识,利用病变和血管之间的相关性,减少了复杂眼底结构引起的病变检测模糊性,提升了模型的准确性,实验结果在DDR和IDRiD数据集上表现出优于其他先进模型的性能。利用全局信息获取外观和运动特征的重要性权重,通过为更重要的模态特征分配更高权重,为较不重要的模态特征分配更低权重,自适应地融合不同模态的特征。通过动态选择不同尺度的特征进行融合,提高了多尺度特征融合的灵活性和融合特征的一致性,解决了不同尺度特征之间的冲突问题。
2024-11-27 10:39:24
3170
原创 【域自适应】热度拉满,疯狂收割顶会!
域自适应的目标就是通过将源域知识迁移到目标域中,来解决目标域任务,提高模型在目标域上的性能。提出了A2GNN模型,该模型采用了不对称的网络架构,通过在目标图上堆叠多个传播层,而在源图上仅使用单个转换层,从而获得了更紧的误差界限。首次研究了GNN在UGDA任务中的固有泛化能力,并提出了一种简单的方法A2GNN,该方法在多个真实世界数据集上超越了现有的最先进方法。提出了一个简单但有效的模型A2GNN,该模型在源图上引入单个转换层,在目标图上堆叠多个传播层,以实现更好的性能。
2024-11-26 17:08:05
1718
原创 暴力涨点!交叉注意力+特征融合,为何频登顶会?
交叉注意力机制允许模型在一个模态的特征上关注另一个模态的特征,从而实现不同模态之间的信息交互。提出了一种新颖的交叉注意力机制,不仅能够利用每种模态内部的内模态关系,还能够利用图像区域和句子单词之间的外模态关系,以互补和增强图像和句子匹配。提出了一种新颖的交叉注意力模块,能够不仅利用每种模态内部的内模态关系,还能够利用图像区域和句子单词之间的外模态关系,以互补和增强图像和句子匹配。提出了一种新颖的多模态交叉注意力网络,通过在统一的深度模型中联合建模图像区域和句子单词的内模态和外模态关系,用于图像和句子匹配。
2024-11-22 17:00:56
3750
原创 又登Nature子刊!特征选择——发高区易如反掌
特征选择(Feature Selection)涉及到从原始特征集中选择最相关、最有信息量的特征子集,能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。DUBStepR通过利用基因间的相关性信息,改进了传统的单细胞数据特征选择方法,这些传统方法通常忽视了这些信息。提出了一种新的度量方法,用于在不知道真实细胞类型标签的情况下,优化特征集的大小,以提高聚类效果。
2024-11-21 16:39:18
1195
原创 打开AI的黑盒子——机器学习可解释性!
随着机器学习模型在各行各业的广泛应用,特别是在医疗、金融、司法等高风险领域,模型的可解释性变得尤为重要。为什么得到这样的结果往往和结果本身一样重要。使用兼容性矩阵和权衡分数优化来确定满足所有要求和约束的最佳权衡分数,为模型开发中的数据效用、隐私和可解释性提供了一个系统和客观的调和手段。提出了一种新的方法,通过调节隐私参数和探索不同配置,找到最大化隐私增益和可解释性相似度,同时最小化对数据效用不利影响的最佳权衡点。通过在多个数据集和多种机器学习模型上的实验,展示了所提出技术的有效性和普适性。
2024-11-19 18:06:51
1353
原创 登上Nature封面!强化学习+卡尔曼滤波上大分
这种结合创新十分有前景,目前多篇成果被顶会顶刊录用,例如"Champion-level drone racing using deep reinforcement learning”这篇登上Nature封面的文章详细描述了Swift系统,一个能够与人类世界冠军级别的无人机竞速选手相匹敌的自主系统。提出了一种新的多AGV路径规划方法PF-DDQN,通过结合PF和RL算法,解决了环境不稳定性导致的神经网络方差问题。通过神经网络和PF的迭代融合过程优化DDQN模型,以获得最优的真实权重值,提高算法的优化效率。
2024-11-18 16:54:11
4617
原创 多尺度卷积+注意力机制=准确率接近100%!
通过多尺度卷积,模型能够捕获不同尺度的特征,而注意力机制则帮助模型聚焦于更重要的特征,从而提高模型的识别能力和准确性。3D-CNN模型能够自动从原始数据中提取信息特征,而无需大量的预处理,这在传统的浅层神经网络中难以实现。在编码器和解码器模块中分别引入混合注意力机制,以推断输入中间特征图中空间点的重要性和通道间关系特征。通过多分支卷积和池化操作,分别提取每种模态的浅层和深层特征,增强了模型对不同层次特征的捕捉能力。通过在深度可分离卷积层中使用多尺度卷积核,扩大了卷积感受野,提高了特征信息的丰富度。
2024-11-15 19:00:37
3303
原创 PINN+贝叶斯=顶会顶刊!思路上升期,好发不卷
提出了使用KL展开和DNF模型作为B-PINNs后验估计器的新方法,这些方法在准确性和计算效率上具有优势,但限于低维问题。首次系统比较了HMC和VI在B-PINNs后验估计中的适用性,以及dropout方法在不确定性量化中的局限性。提出了一种将机器学习模型与符号回归相结合的新方法,以从数据中提取显式的控制方程,增强了模型的解释性和适用性。提出了误差感知B-PINNs,通过增加有用的误差估计来改善预测质量,特别是在模型未训练的区域。
2024-11-14 16:47:35
2761
原创 创新Idea特别好水!小样本学习+目标检测
面向少样本的目标检测任务(FSOOD):提出了一个新的任务定义,专注于用少量标注样本预测未见类别的OBB,这对于实际应用中的快速适应新目标类别具有重要意义。图像-文本匹配训练:通过预训练的变换器基础的通用句子编码器(USE)和额外的文本编码器,提高了图像和文本匹配的准确性。跨训练和联合训练:提出了跨训练和联合训练两种训练方法,以优化模型在不同损失函数下的性能,提高了模型的稳定性和效果。面向少样本的目标检测任务(FSOOD):提出了一个新的任务,即用有限的标注样本预测未见类别的OBB。
2024-11-13 18:27:17
1868
原创 KAN爷又火了?KAN+Transformer结合创新!
多层感知器(MLP)在机器学习领域的重要性不言而喻,然而在Transformer模型中,MLP也存在着明显的缺陷:相对于注意力层来说,在没有后处理分析工具的情况下,它们的可解释性较差。通过数据依赖的方式选择注意力机制中的键-值对位置,使模型能够专注于相关区域,捕获更多信息特征,避免过度的内存和计算成本。通过整合专门的KAN层到U-Net的编码器-解码器架构中,提出了U-KAN框架,以改善视觉任务的骨干网络。探讨了U-KAN作为U-Net噪声预测器的替代方案,证明了其在生成任务导向模型架构中的潜力。
2024-11-12 17:27:30
1772
原创 LSTM又双叒叕火了!LSTM+Attention刷新领域记录!
LSTM与注意力机制的结合为处理序列数据提供了强大的工具,通过模拟人类注意力的过程,允许模型在处理输入数据时更加关注重要的部分,从而提高模型的性能和效果。通过注意力机制,模型能够减少处理高维输入数据的计算负担,专注于输入数据中与当前输出显著相关的有用信息,从而提高输出结果的质量。提出的模型在电影评论情感分类数据集上达到了91%的预测准确率,F1分数达到0.91,超越了当前最先进研究的结果。在编码阶段加入注意力机制,使解码器能够关注输入数据中最相关的部分,提高模型的翻译和预测能力。
2024-11-11 15:59:49
1091
原创 RAG真能优化LLM?丨大模型RAG热门论文解读
提出了未来LLMs应具备自我调节机制的观点,以便它们能够自主调整并对其预期目标的实现负责,从而提高在现实世界社会系统中的可靠性和有效性。提出了一种方法,可以平衡迭代增强的大型语言模型(LLM)用于复杂查询,单步方法用于简单查询,甚至对于最直接的查询不使用检索增强方法。创建了一个广泛的组件框架,用于规划和控制开放环境中的类人机器人,以评估LLMs的核心能力及其在这些组件中的缺陷影响。开发了组件结构图,以模拟LLMs在社会系统中的潜在影响,特别是关注LLMs在不准确或不充分的情况下表现出的自信行为。
2024-11-08 15:32:39
1071
原创 下一代视觉Transformer:CNN+Transformer=Better
近年来,研究者们开始探索将这两种模型结合起来,以期在视觉任务中取得更好的性能。单分支CNN的设计:提出了一种新颖的单分支实时分割网络SCTNet,通过从Transformer对齐语义信息,实现了Transformer的高精度和轻量级单分支CNN的快速推理速度。语义信息对齐模块(SIAM):提出了一种有效的对齐模块,通过训练过程中的特征学习,对齐Transformer和CNN的特征。成对特征的增强:通过成对CNN和成对Transformer特征的融合,提出了一种增强的表示方法,优于单独使用任一特征。
2024-11-06 16:07:46
1637
原创 AAAI2025第二轮分数出炉,祝大家一路绿灯accept!
AAAI 2025采用两阶段审稿流程。第一阶段,每篇论文将被分配给两名审稿人。如果一篇论文收到两份都足够负面的审稿,它将被直接拒绝,没有作者反馈的机会。其余的论文将进入第二阶段审稿。看到很多大佬也在吐槽自己得分,感觉今年有点格外惨烈啊……在两个数据集上的实验表明,NeuNet模型具有优越的分类性能,准确率分别为0.9169和0.9363,成功捕获了神经元的潜在特征表示。提出了一个统一且高效的框架NeuNet,它结合了神经元骨架的形态学信息和连接体的拓扑信息,这在以往的研究中尚未被探索。
2024-11-05 17:21:48
5850
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅