- 博客(499)
- 收藏
- 关注
原创 Spring AI + DeepSeek:提升业务流程的智能推理利器
总结来说,DeepSeek作为推理型助手在提升业务流程中具有巨大的潜力,尽管它不是智能体的首选,但它在推理和数据分析上的强大能力依然可以为您的系统增添显著价值。通过集成到Spring AI与Ollama接口,开发者能够灵活选择适合的模型版本来满足不同的性能需求。随着技术不断发展和硬件条件的提升,DeepSeek将进一步展现其在实际应用中的优势,帮助企业更加高效地实现智能化转型。
2025-03-26 19:54:10
340
原创 完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
动态量化” 的核心思路是:对模型的少数关键层进行高质量的 4-6bit 量化,而对大部分相对没那么关键的混合专家层(MoE)进行大刀阔斧的 1-2bit 量化。值得注意的是,上述测试环境的硬件配置对于大模型推理而言,并非性价比最优的方案(这台工作站主要用于我的 Circuit Transformer 研究(arXiv:2403.13838),该研究在上周于 ICLR 会议接收。在多次测试下,1.73-bit 版本的输出始终相当 “毒舌”,而 4-bit 的版本则始终以不同方式礼貌拒绝该提示。
2025-03-26 17:13:00
497
原创 一文读懂 RAGFlow 知识库接入 Dify 的全流程
今天来给大家分享一下,如何将ragflow知识库接入dify,作为dify的外挂知识库。如果知识库配置RAPTOR策略的话,需要配置大模型,此处跟Dify上配置模型类似,rerank模型,embedding模型已经默认配置好,无需再配置,只需配置chat模型即可,配置上后,方便其他地方使用。此处先以最简单配置。 参考地址:外部知识库 API | Dify貌似找不出什么,因为这个节点肯定是由外部知识库定义,只要遵循Dify的端点定义要求就行了,即:url路径中要有一个/retrieval我在0.13版本的更
2025-03-26 17:02:06
195
原创 知识Agent检索:让RAG迸发智慧的五个架构跃迁点
好的架构不是追求技术时髦,而是精准把握"该在何处复杂"。五个跃迁点的本质,是把人类的思维模式翻译成机器可执行的流程。"如果我是这个问题,希望被怎样解决?这或许就是智能设计的起点。
2025-03-26 16:54:12
367
原创 纯小白的大模型 Prompt 编写技巧
提示词(Prompt)是输入给大模型(LLM)的文本信息,用于明确地告诉模型要解决的问题或完成的任务,也是大语言模型理解需求并生成相关、准确回答或内容的基础,是至关重要的。
2025-03-26 16:51:22
415
原创 MCP:AI 时代的工具接口标准?
自从 OpenAI 在 2023 年推出函数调用(Function Calling),我一直思考,咋能真正解锁 AI Agent与工具的生态系统。随基础模型越来越智能,AI Agent与外部工具、数据和 API 的交互方式却变得越来越碎片化——开发者需针对每一个系统单独编写业务逻辑,让Agent能够适配不同环境。MCP 是一种开放协议,旨在让不同系统能够为 AI 模型提供可泛化的上下文信息。它规定了AI Agent如何调用外部工具、获取数据,并与服务交互。Resend MCP 服务器。
2025-03-25 21:37:16
381
原创 为什么都放弃了LangChain?
随着 LangChain 的不灵活性开始显现,我们开始深入研究 LangChain 的内部结构,以改进系统的底层行为。看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点,不看好 LangChain 的人,认为它注定失败 —— 在这个技术变化如此之快的年代,用 LangChain 来构建一切根本行不通。Agent 领域正在快速发展,带来了令人兴奋的可能性和有趣的用例,但我们建议 —— 在 Agent 的使用模式得到巩固之前,暂时保持简单。但事后看来,如果没有框架,我们的长期发展会更好。
2025-03-25 21:36:06
254
原创 OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
另外,Mark Chen 提到的「外界的反应有些过度夸大,特别是在成本方面的说法」这一点最近也被很多人讨论,尤其是「DeepSeek-v3 训练成本仅为 558 万美元」这一说法。其实,DeepSeek-v3 的技术报告原文是这么写的:「上述成本仅包括 DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本」。他表示,DeepSeek 确实独立发现了一些 OpenAI o1 也在用的核心理念,不过,这并不代表 OpenAI 在算力上的高投入是不合理的。
2025-03-25 21:28:50
427
原创 用RPA全自动化批量生产【生僻字】图片做小红书商单,保姆级工具开发教程(附工具下载)
今天带大家一起来实战前段时间比较火的小红书【生僻字】项目。工具在最后,也免费分享给大家。通过生僻字做小红书商单,快速涨粉起号,商单200元/单,一个月小几千还是非常香的,而且还可以矩阵做号,于是我就通过【影刀RPA+cursor】开发了一个批量自动化生产生僻字的工具,最后给粉丝们提供了工具下载,可免费试用,无费用。这个项目比较固定,不仅可以做小红书,视频号、抖音也同样可以发。于是就在思考怎么通过RPA达到批量生产做矩阵的目的。
2025-03-25 21:24:31
350
原创 如何使用免费的 LLM 模型和知识库创建自己的 RAG
使用 Sentence Transformers 的语义搜索系统使用 T5 的答案生成系统。
2025-03-25 21:20:45
533
原创 [特殊字符][特殊字符] Crawl4AI:开源LLM友好型网页爬虫与数据提取工具
Crawl4AI是一款专为AI开发者设计的开源网页爬虫工具,凭借其极速性能、灵活的浏览器控制和智能提取算法,成为GitHub上最热门的项目之一。无论你是需要处理动态网页、提取结构化数据,还是部署大规模爬取任务,Crawl4AI都能满足你的需求。快来试试吧!✨ 访问我们的文档网站获取更多信息,或直接在Colab上体验Crawl4AI的强大功能!🕸️🚀。
2025-03-24 21:23:28
650
原创 27K star!开源AI程序员,可独立完成95%的开发任务
GPT Pilot的主要用途是帮助开发人员更快速地构建应用程序。它的设计上实现了现在非常前言的多智能体设计,通过多个不同角色的ai agent协同工作来完成一个复杂的开发任务。关于多智能体,最新的吴恩达演讲中也提出了很多内容,非常值得研究一下。它的过程更加贴合目前可接受的方式,您则负责监督开发过程,AI来完成任务执行。当GPT Pilot完成每个任务或遇到困难时,它会要求您审查任务或在需要时提供帮助。快速原型开发:您可以使用GPT Pilot快速创建应用程序的原型,以便在不浪费太多时间的情况下验证概念。
2025-03-24 21:18:56
497
原创 解密prompt系列43. LLM Self Critics
人类提供的监督信号有几类,包括人工直接生成最优回答(Demonstration), 人工提供偏好对比(Preference),人工给出优化建议(Critique)等几种,论文中曾提及以上几类信号的难易程度所以RLHF阶段的引入,除了降低模型模仿,提升泛化,增加更高水平的对齐,其实也有一部分原因是人类生成golden answer的上限是比较低的,毕竟不能雇佣一堆各领域专家来给你生成最优回答,所以训练也就从人类标注转移到了人类评估。
2025-03-24 21:14:12
765
原创 AI编程太牛了[特殊字符],利用字节的Trae(大模型基座Claude-3.5-Sonnet)实现的初版CRM小程序
简单来说,我需要为公司的销售们实现一个客户跟进助手,算是CRM吧。就是销售们能看到自己要跟进的客户,以及客户的等级画像、销售策略等。我们的销售大都是跑外勤的,所以手机小程序是比较好的选择。我本身是做后端跟算法,对于前端技术了解的不是太多。我们是创业公司,就一个前端,过年请假了。我只能硬着头皮上了。一开始是遇到不懂的就问通义或者chatgpt,一个样式问题经常是问好几个模型,也达不到理想效果。并且由于无法给大模型足够的上下文,经常导致驴唇不对马嘴。Cursor跟Trae是朋友推荐给我的。
2025-03-24 20:48:58
128
原创 如何搭建DeepSeek R1的训推环境?
本篇文章主要介绍基于Linux系统的Tesla A30 GPU的硬件环境搭建深度学习环境,为训练和推理DeepSeek R1 提供必要的环境,篇幅最后也会介绍到MIG的一些常见报错解决方案。(可选)如果没有运行权限,需要加运行权限。
2025-03-24 20:40:43
622
原创 AI Coding 是大趋势,写在 2024 年最后一天
前些日子,我利用闲暇时光做了一款 AI 游戏,从设计、美术、数值、程序到音效,所有的内容皆是借助 AI 工具完成。说实话,搁在过去,开发这般程度的游戏,花费的时间可不短,保守估计至少得一周,这还只是程序方面,如果算上设计、美术和音乐的时间,恐怕远远不止。人工智能的浪潮,浩浩荡荡,无法阻挡。编程,向来是彰显技术人价值的有力杠杆,而 AI 呢,它也是能映照任何人价值的杠杆。这款游戏给了我灵感,在我深入探究 AI Coding 这个赛道后,我笃定,AI Coding 赛道即将爆发,全民编程的时代即将来临。
2025-03-24 20:28:00
171
原创 MCP:基于Mcp Java SDK 开发一个 Mcp Client
在文章介绍了 MCP 协议的核心概念,有些内容可能还是有点晦涩难懂,后续文章将通过实现一些实际的案例,深入理解并清楚其使用的场景和效果。MCP Client 理解为可以支持 MCP 协议的客户端,本文重点在于如何使用 SDK 开发一个 MCP Client。我们直入主题,直接看 Java SDK 源码以及如何开发一个 MCP Client。
2025-03-24 20:26:02
847
原创 腾讯云HAI服务器上部署与调用DeepSeek-R1大模型的实战指南
通过本次实践,我们成功地使用腾讯云的HAI服务器进行了DeepSeek-R1大模型的部署与实时调用。从购买HAI应用服务,到通过ChatBotUI、JupyterLab、CloudStudio等工具进行配置和调试,我们详细介绍了每个步骤。通过本地和外网API的操作,我们不仅了解了模型部署的基本流程,还掌握了如何利用Ollama提供的API服务进行大模型调用。
2025-03-24 20:22:59
494
原创 Manus 被破解了?曝出系统提示词和背后大模型,CTO 也回复了
不过,也有人质疑 jian 的发现,该网友表示自己已经拿到了 Manus 的邀请码,并让 Manus 输出 /opt/.manus 目录内容为一个 zip 文件。不过从 Manus 官方回应来看,现在公布的越狱内容还是可信的。对于上文提到的 Manus 使用了 browser_use 开源代码,「Browser Use」官方评价道:「事实证明,Manus 只是另一个 Browser Use 包装器。不过,Manus 这次被「越狱」也提醒我们,在加强 AI 功能的同时,安全性也是一个不容忽略的问题。
2025-03-24 20:17:05
693
原创 DeepSeek,本地部署➕图形化界面搞定!详细步骤
DeepSeek,本地部署➕图形化界面 搞定!这篇文章提供了关于如何在本地部署DeepSeek的详细指南,并强调了通过图形化界面简化操作的优势。文中详细介绍了从安装到配置的具体步骤,帮助读者轻松完成本地部署。
2025-03-24 20:08:25
331
原创 antd 对 ai 下手了!Vue 开发者表示羡慕!
前端开发者应该对 Ant Design 不陌生,特别是 React 开发者,antd 应该是组件库的标配了。近年来随着 AI 的爆火,凡是想要接入 AI 的都想搞一套自己的 AI 交互界面。专注于 AI 场景组件库的开源项目倒不是很多见,,使用 React 构建 AI 驱动的用户交互变得更简单了,它可以无缝集成 AI 聊天组件和 API 服务,简化 AI 界面的开发流程。该项目已在 Github 开源,拥有 1.6K Star!看了网友的评论,看来大家还是需要的!
2025-03-23 21:18:30
249
原创 Cline + DeepSeek-V3 对打 Cursor,谁更胜一筹?
Cursor 好用是真的好用,也是笔者体验过最好用的 AI 辅助工具了,在试用期过后,也看到很多人对 Cursor 每月的20$费用望而却步!毕竟这20$能让我喝好几碗羊肉汤...!近期国产大模型 DeepSeek 发布了 v3 版本,性能大幅提升,可以媲美当前的老大哥 Claude-3.5-Sonnet,同时价格也很美丽,如果说 Cursor 每个月要花 20$,DeepSeek 可能把后面的单位去掉就可以了,瞬间是不是感觉香了?毕竟能省不少啊。
2025-03-23 21:14:43
660
原创 构建强大AI智能体常用的设计模式
构建一个强大的AI智能体需要综合运用多种设计模式,从传统软件工程模式到AI特定模式。以下是一个全面的设计模式框架,可以帮助构建高性能、可扩展且健壮的AI智能体系统。
2025-03-23 21:09:34
584
原创 2025年每个开发人员都应该掌握的 7 个尖端 AI 框架
LangChain 以其模块化架构和专为生成式 AI 开发设计的全套工具脱颖而出。及时管理和优化数据增强生成自主决策代理情境保留的记忆系统广泛的集成能力这些组件无缝协作,使开发人员能够创建复杂的应用程序,而不会受到复杂基础设施管理的困扰。从本质上讲,JARVIS 是一个协作系统,利用 ChatGPT 作为其主要控制器,与 Hugging Face 生态系统中的众多专家模型进行协调。多模态处理能力实时 Web 访问集成先进的任务规划系统跨模型协作全面的 API 支持。
2025-03-23 20:57:30
1039
原创 AI工具推荐:领先的开源 AI 代码助手——Continue
之前介绍了VS Code中的AI插件Cline与Roo Code,这两个都是根据给定一个任务,开始自动写代码的。除了这两个AI代码工具之外,在平常我还很喜欢的就是Continue。Continue 是领先的开源 AI 代码助手。你可以连接任何模型和任何上下文,在 VS Code 和 JetBrains 中构建自定义的自动完成功能和聊天体验。
2025-03-23 20:50:29
360
原创 使用 DeepSeek 实现 100% 本地 RAG
创建嵌入后,下一个任务是将它们索引并存储在向量数据库中。疯狂的是,它实现了与 OpenAI o1 类似的性能,但成本却低得多(便宜约 95%)。最后,我们设置一个查询引擎,它接受查询字符串并使用它来获取相关上下文。DeepSeek AI发布了一些开放权重推理模型(例如o1)。然后,它将上下文和查询作为提示发送给 LLM,以生成最终响应。今天,让我们向您展示我们使用 DeepSeek 构建的**这难道不简单又直接吗?
2025-03-23 20:40:34
292
原创 我问ChatGPT:为什么DeepSeek是“国运级”突破?
身为科技圈的人,我的内心无比澎湃。这不仅仅是一个技术突破,不仅仅是一家公司的成功,而是一种不可阻挡的时代浪潮。回望过去,我们曾一次次被技术封锁,被资源掣肘,被人卡住命脉,但今天,我们用智慧和韧性杀出了一条自己的路。中国不止有大市场,更有大创新,不止能追赶,更能超越!这场 AI 变革,会席卷整个社会:它将渗透到每一个行业,让生产更高效、科研更高速、社会更智能。它将深入政府和核心机构,让国家运转更加精准,决策更加科学。它将赋能无数普通人,让小人物也能借助 AI 之力,创造属于自己的奇迹。
2025-03-23 20:37:26
692
原创 微软悄悄发布了全新纯视觉AI工具!一张屏幕截图,即可精准操作你的电脑!
是微软推出的一款全新升级的界面解析工具,用于将用户界面截图解析为结构化和易于理解的元素,让 AI 能够更准确的操作相应界面。本质是一个基于纯视觉的GUI代理。说白了,就是通过它,帮助AI更好地理解和操作计算机界面。与前一代Omniparser相比,V2在多个方面进行了显著的优化,尤其是在图标和可交互元素的检测上,让其具备了像素级的屏幕理解能力。还有一大亮点功能:同步开源了 OmniTool 全能工具,集成在 OmniParser 项目中。
2025-03-23 20:35:14
707
原创 AnythingLLM + Ollama 实现私有知识库
是一款开箱即用的一体化 AI 应用,支持 RAG(检索增强生成)、AI 代理等功能。它无需编写代码或处理复杂的基础设施问题,适合快速搭建私有知识库和智能问答系统。通过和Ollama的结合,我们成功搭建了一个具备私有知识库能力的 AI 应用。私有知识库不仅可以让 AI 回答通用问题,还能基于私有文档(如企业内部资料、图书等)生成更精准的答案。注意: 随着知识库中文档数量的增加,回答的准确性可能会受到影响。建议将文档分散到多个工作区,以提高检索效率。
2025-03-23 20:29:28
946
原创 从零开始玩转 DeepSeek:程序员的高效 AI 助手指南(附代码)
最近两个星期,DeepSeek 在互联网上引发了新一波有关生成式 AI 大模型的讨论,讨论的热烈程度不亚于当初 ChatGPT 刚出世的时候。那么,在新一波的 AI 浪潮下,普通人和程序员又该如何面对呢?下面,就让笔者来为普通人和程序员读者朋友分别给出一点参考方案。DeepSeek 这一波开源是彻底击穿了 OpenAI 所塑造的技术壁垒,将全球的 AI 大模型使用成本拉低到一个全新的价格,这使得以前成本高昂的方案,现在可以以极低的成本实现。
2025-03-23 20:17:07
864
原创 docker容器中deepspeed多机多卡集群分布式训练大模型
众所周知,大模型的训练需要大量的显存资源,单卡很容易就爆了,于是就有了单机多卡、多机多卡的训练方案。本文主要是介绍如何使用deepspeed框架做多机多卡的分布式训练。由于PyTorch、NVIDIA、CUDA等运行环境搭建也是很繁琐,所以这次我们用docker来快速搭建,但是deepspeed多机训练是通过ssh来通讯的,不同服务器的docker容器通讯是个麻烦事。还好,docker可以创建overlay网络来解决这个问题。
2025-03-21 20:40:00
808
原创 llama3.1 原模型及中文微调模型使用效果汇报
开源的力量是越来越强大,Meta这条路子总算是走对了,未来LLAMA成为大模型一个指日可待,干翻闭源模型也指日可待。其实不管怎么说8B的模型大小也就是能随便玩玩,想正式进入商用阶段还得使用70B、甚至405B,如果真的有一天8B的模型能够商用,也就是小模型能在消费级显卡上面支持商用,那真的是人工智能的到来之日。就在发文的功夫,最强开源的位置易主了,已经是LLAMA3.1的霸主之位只坐了一天,再次感叹开源力量,太卷了。
2025-03-21 20:27:49
562
原创 LLM模型的通病:模型坍塌
模型坍塌是指生成模型由于过度使用低质量数据或对类似模型的输出进行重复微调而导致性能下降的现象。这种退化表现为模型输出的多样性减少、泛化能力降低,以及在超出其训练分布的任务中表现能力减弱。第一代大型语言模型是通过抓取互联网数据并使用人类反馈强化学习(RLHF)等技术进行微调训练的。随着AI工具生成内容的使用增加,人们担心如果未来的训练数据也来自网络抓取,那么LLMs不可避免地会使用自身输出进行训练。最近一篇文章指出,到2026年,90%的在线内容将由AI生成。
2025-03-21 20:24:07
968
原创 高级RAG:使用PyMuPDF4LLM解析PDF的图片和表格
最近在做RAG相关的应用,需要对PDF文件进行解析处理,最开始使用PyPDF2,该工具只能从PDF文件中提取纯文本且没有格式。很多的PDF文件中包含图片和表格,需要将图片和表格都提取出来,并且需要保留PDF文件的文本格式。通过查阅相关文档,找到一个开源工具,这个包使用PyMuPDF将PDF的页面转换为Markdown格式的文本,并且支持表格和图片抽取。介绍的使用,并且给出相关的使用示例。
2025-03-21 20:20:17
911
原创 如何使用Cloudflare白嫖一个文生图且支持API的大模型服务
白嫖的算力和服务,可以用来为自己的日常工作添砖加瓦,或者做点什么。比如我们基于qwen1.5搭了一个AI角色扮演的站点:相比本地搭建一些大模型,使用cloudflare提供的服务就能省下很多成本啦~
2025-03-21 20:12:52
286
原创 KIMI爆了!对比文心一言和通义千问它到底有多强?
最近国产大模型KIMI爆了大部分人应该都知道了,从我个人的感受来看这次KIMI爆了我不是从技术领域接触到的,而是从各种金融领域接触到的。目前国内大模型可以说是百模大战,前几年新能源大战,今年资本割完韭菜后留给我们的是一家家倒闭或者即将要倒闭的车企,今年有一句话听了让人非常的无奈:"如果前几年你买了房子,又买了车子,你不仅要担心你的房子什么时候会爆雷还要担心你的车子什么时候会爆雷"。过几年大模型爆雷注定是不可避免不的,想想当年火爆的OFO到现在200多块钱的押金还没退给我。
2025-03-21 20:05:48
812
原创 5分钟带你了解如何获取deepseek api并实现简易问答
deepseek-v3是截止博文撰写之日,无论是国内还是国际上发布的大模型中表现十分亮眼的模型,这里以deepseek为例,讲解如何获取api_key、base_url、chat_model。
2025-03-21 19:58:13
873
原创 LLM - 基于LM Studio本地部署DeepSeek-R1的蒸馏量化模型
目前,受限于设备性能,在本地部署的基本都是DeepSeek-R1的蒸馏量化模型,这些蒸馏量化模型的表现可能并没有你想象的那么好。绝大部分人并不需要本地部署,直接用现成的服务是更好的选择(特别是只能部署14B参数以下模型的设备)。本文章基于macOS以及LM Studio本地部署,全程无需代理,力求让你快速学会部署自己的大语言模型。当然,你也可以参考其他文章使用Ollama部署。
2025-03-21 19:53:33
635
原创 数字人+LLM 开发过程记录
结论:数字人是比较鸡肋比较KPI的人工智能应用,它的应用场景仅限于生成视频投放到视频网站上或者去直播。在任何生产环境中很难提供真正的生产力。苹果的Siri等手机助手各种车机、物联网设备各种大模型的应用银行等机构的服务机器人没有一个是使用数字人的,算力是一方面,更重要的是根本没有达到算力应有的效果和实际的生产力。纯鸡肋。
2025-03-21 19:46:01
916
原创 Graph-RAG:知识图谱与大模型的融合
本文的探讨让我们认识到,Graph-RAG 不仅是一种技术进步,它更是一种思考方式的革新。Graph-RAG 系统以其独特的能力,让我们在数据的海洋中航行得更远,理解得更深。展望未来,我们期待这一系统能够继续进化,成为连接知识孤岛、激发创新思维的桥梁,引领我们进入一个更加智能和互联的信息时代。
2025-03-21 19:42:48
793
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人