- 博客(121)
- 收藏
- 关注
原创 Linux服务器部署n8n实战教程
n8n是一款开源自动化工具,支持低代码/无代码方式构建工作流,具备400+应用集成、AI代理(基于LangChain)和公平代码许可。主要特性包括:JavaScript/Python代码支持、企业级权限管理、900+现成模板和社区支持。安装方式提供Docker部署,通过映射端口5678访问Web界面。针对中文用户,可通过安装i18n插件实现界面汉化,解压文件至指定目录并设置环境变量即可完成本地化。该工具允许用户完全控制数据,支持自托管或云端部署。
2025-06-12 15:53:04
214
原创 Linux服务器安装mamba
Mamba 模型介绍不在这里多说,此文主要讲 Mamba 环境的搭建。简单来说,其核心在于通过输入依赖的方式调整SSM参数,允许模型根据当前的数据选择性地传递或遗忘信息,从而解决了以前模型在处理离散和信息密集型数据(如文本)时的不足。这种改进使得Mamba在处理长序列时展现出更高的效率和性能,并与 `Transformer` 可以打平手的情况下,比 `Transformer` 复杂度更低。
2025-06-12 14:37:53
438
原创 SGFormer:卫星-地面融合 3D 语义场景补全
最近,基于摄像头的解决方案在场景语义补全(SSC)方面得到了广泛探索。尽管它们在可见区域取得了成功,但现有方法由于频繁的视觉遮挡,在捕捉完整场景语义方面存在困难。为了解决这一局限性,本文提出了第一个卫星-地面协同 SSC 框架,即 SGFormer,探索卫星-地面图像对在 SSC 任务中的潜力。具体来说,我们提出了一种双分支架构,并行编码正交的卫星和地面视图,并将它们统一到公共域中。此外,我们设计了一种地面视图引导策略,在特征编码期间纠正卫星图像偏差,解决卫星和地面视图之间的错位。
2025-04-15 16:22:05
1034
原创 vGamba:注意力状态空间瓶颈在视觉识别中有效处理长距离依赖
高效捕获长程依赖关系对视觉识别任务至关重要,但现有方法存在局限。卷积神经网络(CNN)受限于感受野范围,而视觉Transformer(ViT)虽能实现全局上下文建模却计算成本高昂。状态空间模型(SSM)提供了新思路,但其在视觉领域的应用尚未充分探索。本研究提出vGamba混合视觉主干网络,通过整合SSM与注意力机制来提升效率与表征能力。其核心Gamba瓶颈模块包含:适配2D2D2D空间结构的Mamba变体Gamba Cell、多头自注意力机制(MHSA),以及用于特征表征的门控融合模块。
2025-04-10 15:29:15
417
原创 XLRS-Bench:您能否理解极端大型超高分辨率遥感影像?
多模态大型语言模型(MLLMs)的惊人突破需要新的基准来定量评估其能力、揭示其局限性并指示未来的研究方向。然而,在遥感(RS)的背景下,这具有挑战性,因为图像具有超高清分辨率,包含极其复杂的语义关系。现有的基准通常采用明显小于现实世界 RS 场景的图像尺寸,注释质量有限,且评估维度不足。
2025-04-03 14:13:26
1171
原创 RoMA: 基于Mamba的遥感基础模型, 已开源, 首次验证mamba的scaling能力
Mamba模型在遥感领域的应用展示了计算机视觉模型架构创新的广阔前景。
2025-03-27 20:39:52
968
原创 缺少 CMake,无法安装 dlib
缺少 CMake,无法安装 dlib,出现ERROR: Failed to build installable wheels for some pyproject.toml based projects (dlib)
2025-02-28 10:35:32
407
原创 ragflow-mysql 启动失败案例分析
ragflow-mysql 启动失败案例分析,CPU does not support x86-64-v2 Fatal glibc error: CPU does not support x86-64-v2
2025-02-28 10:21:19
4224
原创 DeepSeek-Janus-Pro-7B模型接入vision-agent后端测试chat前端配置代码
使用gguf/DeepSeek-Janus-Pro-7B作为模型后端的服务接入Vision-Agent,config.py代码
2025-02-25 14:17:04
489
9
原创 Dify客户端异常error: a client-side exception has occurred (see the browser console for more i
bug] Dify客户端异常。
2025-02-25 09:23:41
14271
38
原创 Linux升级Anacodna并配置jupyterLab
在使用 Anaconda 的过程中,随着项目和需求的发展,可能需要升级 Anaconda 的 Base 环境中的 Python 版本。本文将详细介绍如何安全地进行升级,包括步骤、代码示例与最终流程图。
2025-02-18 11:08:33
444
原创 Linux安装cuda和cudnn实战教程
Linux服务器安装cuda和cudnn实战教程,Driver CUDA冲突,`cuDNN` 的多个文件(共享库)不是符号链接
2025-02-17 17:32:14
3817
2
原创 Linux服务器配置onnxruntime-gpu
本文实现 `onnxruntime-gpu` 不依赖于服务器主机上 `cuda` 和 `cudnn`,仅使用虚拟环境中的 `cuda` 依赖包实现 `onnx` `GPU` 推理加速的安装教程。为了适配推理节点,因此我们仅在 `base` 下配置环境,不需要重新创建新的虚拟环境。
2025-01-16 18:04:33
1926
原创 [解决方法]libGL.so.1: cannot open shared object file: No such file or directory
在服务器环境配置尝试导入 `opencv` (`cv2`) 模块时,系统找不到 `libGL.so.1` 这个共享库文件。这个问题通常出现在 `Linux` 系统中,特别是当系统缺少必要的图形库时。
2025-01-16 18:00:26
887
原创 MMDetection安装实战教程
MMDetection 支持在 `Linux`,`Windows` 和 `macOS` 上运行,其实在 `Windows` 和 `Linux` 上配置环境区别不大,建议有条件还是在 `Linux` 上配置,它需要 ` Python 3.7 ` 以上,` CUDA 9.2 ` 以上和 ` PyTorch1.8 ` 及其以上。
2025-01-15 15:52:42
1916
原创 匹配一切新框架!浙大提出MatchAnything:通过大规模预训练实现通用跨模态图像匹配论文解析(中文版)
图像匹配旨在识别图像之间相应的像素位置,在广泛的科学学科中至关重要,有助于图像配准、融合和分析。
2025-01-15 10:20:35
3450
原创 中科院空天院无人机视觉语言导航新基准!AeroVerse:模拟、预训练、微调和评估空中无人机具身世界模型的测试基准
是如何增强无人航空飞行器(UAV)和其他航天平台在四维时空中进行自主感知、认知过程和行动能力,从而实现与人类和环境之间的以自我为中心的活动交互。
2025-01-12 11:40:35
963
原创 GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力
像个善于制作思维导图的导师,将冗长的文本转化为清晰的知识网络,让AI能够像沿着地图探索一样,轻松找到答案需要的各个关键点,有效克服了处理长文本时的"迷路"问题。这篇文章介绍了GraphReader,一种基于图结构的智能体系统,旨在解决大型语言模型(LLMs)处理长文本时遇到的挑战,并在多跳问答等任务上表现出色。
2025-01-09 21:10:30
824
原创 谷歌Agents与基础应用白皮书(中文版)
人类非常擅长处理混乱的模式识别任务。然而,他们通常依赖工具 —— 如书籍、Google 搜索或计算器 —— 来补充他们先前的知识,然后才能得出结论。
2025-01-09 20:47:11
1570
原创 yolov目标检测的图片onnx输入尺寸及预处理
当你使用不同的图像尺寸(例如1280)进行预测时,YOLOv8会自动对输入图像进行适当的预处理以适配模型。这通常包括缩放和填充操作,确保图像不会发生畸变,同时保持原始宽高比。
2024-12-19 09:58:27
1282
原创 AI领域最伟大的论文检索网站
📑 苏剑林(Jianlin Su)开发的“Cool Papers”网站旨在通过沉浸式体验提升科研工作者浏览论文的效率和乐趣。这个平台的核心优势在于利用Kimi的智能回答功能,帮助用户快速了解论文的常见问题(FAQ),从而更准确地判断论文的价值和相关性,决定是否需要深入阅读。
2024-05-11 12:38:28
1638
2
原创 Att论文解读|ICLR 2018 《Graph attention networks》图注意力网络
我们提出了图注意力网络(GATs),这是一种可在图结构数据上运行的新型神经网络架构,它利用掩码自注意力层来解决之前基于图卷积或其近似值的方法的不足之处。通过堆叠节点能够关注其邻域特征的层,我们能够(隐式地)为邻域中的不同节点指定不同的权重,而不需要任何形式的代价高昂的矩阵运算(如反转),也不依赖于对图结构的预先了解。通过这种方式,我们同时解决了基于谱的图神经网络所面临的几个关键挑战,并使我们的模型可随时应用于归纳和转换问题。
2024-05-11 10:26:18
2698
原创 Sarcasm detection论文解析 |基于混合自动编码器的模型对社交媒体平台进行讽刺检
早先已经提出了各种单独的自然语言处理技术,但每种技术都有文本上下文和邻近性的限制。它们无法处理不同的内容类型。在本研究论文中,我们使用自动编码器提出了一种基于句子嵌入的新型混合技术。该框架建议使用来自长短期记忆自动编码器、双向编码器表示变换器和通用句子编码器的句子嵌入。此外,还考虑了图像上的文本,以处理图像和视频等多媒体内容。在对各种混合融合模型进行消融研究后,设计出了最终框架。
2024-05-10 20:00:00
1080
邱锡鹏著 《神经网络与深度学习》案例与实践实验1-5中所需的nndl包
2023-11-10
单级放大电路的搭建与测试
2023-03-22
模拟电子技术实验指导书
2023-03-22
关于已删除文章索引依然存在的问题!
2025-05-14
关于已删除文章索引依然存在的问题!
2025-05-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人