- 博客(727)
- 收藏
- 关注
原创 LangFlow技术深度解析:可视化编排LangChain应用的新范式 -(3)组件系统
Langflow 中的组件系统是围绕分层类结构构建的,该结构允许灵活地创建组件,同时强制执行一致的接口。组件可以表示各种功能,从语言模型和工具到数据转换器和 I/O 处理程序。来源/backend/base/langflow/custom/custom_component/component.py96-446来源/backend/base/langflow/custom/custom_component/custom_component.py35-190Componentinputs = [
2025-05-16 17:25:25
618
原创 LangFlow技术深度解析:可视化编排LangChain应用的新范式 -(2)流编辑器系统
流编辑器系统构建在 ReactFlow 之上,并遵循基于组件的架构,状态管理由 Zustand 存储处理。来源/前端/src/pages/FlowPage/components/PageComponent/index.tsx来源/前端/来源/商店/flowsManagerStore.ts在 Langflow 中,流由由边(表示数据流)连接的节点(表示组件或功能)组成。可视化界面建立在 React Flow 之上,React Flow 为图形编辑器提供了基本功能。
2025-05-16 17:23:49
945
原创 LangFlow技术深度解析:可视化编排LangChain应用的新范式 -(1)系统架构
相关源文件Langflow 是一个强大的工具,它将可视化开发与代码可访问性联系起来,允许用户通过拖放界面创建复杂的 LLM 应用程序,同时保持通过 Python 代码进行自定义的能力。Langflow 中内置的每个流都可以立即作为 API 端点公开,从而实现与现有应用程序的无缝集成。pyproject.toml 文件3-9前端架构遵循现代 React 模式,采用基于组件的设计,通过 Zustand 进行状态管理,并使用 React Router 进行路由。
2025-05-16 17:19:43
839
原创 【MinerU技术原理深度解析】大模型时代的文档解析革命
在AI技术快速发展的今天,大量非结构化数据的处理成为亟待解决的问题。尤其是PDF文档,作为最常见的文件格式之一,如何高效准确地提取其中的信息,成为了许多企业和研究机构的痛点。上海人工智能实验室(上海AI实验室)大模型数据基座OpenDataLab团队开源了全新的智能数据提取工具——MinerU,旨在解决这一问题。MinerU能够将混合了图片、公式、表格、脚注等复杂元素的PDF文档转化为Markdown和JSON格式,大幅提升了AI语料的准备效率。
2025-05-02 11:44:13
1139
原创 《3天狂揽3000星!LangManus本地部署全流程:手把手教你玩转国产AI自动化神器》
我想要一份英伟达股票的全面分析,包括:概述:公司概况、关键指标、业绩数据和投资建议财务数据:收入趋势、利润率、资产负债表和现金流分析市场情绪:分析师评级、情绪指标和新闻影响技术分析:价格趋势、技术指标和支撑/阻力水平资产比较:市场份额和与主要竞争对手的财务指标对比价值投资者:内在价值、增长潜力和风险因素投资论点:SWOT 分析和针对不同类型投资者的建议。运行量化模型(如 qwq3bit),节省显存且响应更快。:输入任务描述,系统自动完成数据采集、分析及可视化。
2025-04-13 16:16:50
757
原创 【智能体】MCP技术解析:重塑AI协作新范式
MCP(Model Context Protocol,模型上下文协议) ,2024年11月底,由 Anthropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题,MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。
2025-03-13 00:20:36
1870
原创 【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析
知识蒸馏是一种模型压缩和加速的方法,旨在将大型、复杂的模型(教师模型)的知识转移到小型、高效的模型(学生模型)中。这一技术的核心思想是利用教师模型的输出(如软标签)来指导学生模型的训练,从而在保持较高性能的同时,显著减少模型的计算资源和存储需求。
2025-02-06 13:53:17
6841
1
原创 【AI编辑器】字节跳动推出AI IDE——Trae,专为中文开发者深度定制
字节跳动推出的Trae不仅是一款强大的AI IDE,更是一场关于编程方式变革的开始。它通过智能化的代码生成、补全、问答和审查功能,大大提高了开发效率和质量。同时,Trae还支持多种语言和主题,更加符合中文开发者的使用习惯。此外,它还提供了丰富的插件和扩展功能,以及高度可定制化的架构设计,使得开发者能够根据自己的需求进行个性化配置。与Cursor和Windsurf相比,Trae在AI代码自动生成、智能问答和多语言支持等方面具有显著优势。
2025-01-22 00:56:49
19516
1
原创 【LLM应用实战】文档问答系统Kotaemon-简介及部署实践
Kotaemon是一个RAG UI页面,主要面向DocQA的终端用户和构建自己RAG pipeline的开发者。本文主要针对开源文档问答系统Kotaemon的介绍,包括主要功能特点,与传统文档RAG的区别,部署教程以及效果体验等。目前Kotaemon针对中文语言支持不友好,但既然可以通过ollama进行部署LLM和Embedding模型,因此支持中文语言也是相对容易开发集成的。
2025-01-21 16:48:26
1397
2
原创 【Dify】RAG开源框架Dify:技术深度剖析与实践指南
Dify作为一个开源的RAG框架,凭借其强大的数据集管理功能、可视化的Prompt编排、高效的RAG管道、灵活的Agent功能以及多种大型语言模型的支持,为开发者提供了一个快速搭建生产级AI应用的平台。无论是对于技术人员还是非技术人员来说,Dify都大大降低了AI应用开发的复杂度,使得更多人能够参与到AI应用的开发和创新中来。未来,随着技术的不断进步和应用场景的不断拓展,Dify有望在人工智能领域发挥更加重要的作用。例如,通过引入更多的自然语言理解和生成技术,Dify可以进一步提升其问答和文本生成的能力。
2025-01-14 12:06:36
2477
原创 【DB-GPT】开启数据库交互新篇章的技术探索与实践
DB-GPT作为一个开源的AI原生数据应用开发框架,具有广泛的应用前景和发展潜力。通过整合自然语言处理、机器学习、数据库管理等多种先进技术,DB-GPT为开发者提供了一个简洁、高效、可扩展的开发平台。在未来,随着技术的不断发展和应用场景的不断拓展,DB-GPT将会在更多领域发挥重要作用。同时,我们也期待更多的开发者和企业能够加入到DB-GPT的社区中来,共同推动技术的发展和应用的普及。通过不断地探索和创新,我们相信DB-GPT将会为数字化转型和智能化发展注入新的活力和动力。
2025-01-11 13:28:21
1843
原创 【AI程序员】通义灵码 AI 程序员全面上线JAVA使用体验
这款 AI 程序员不仅是一款简单的编码助手,更是一个智能编程伙伴,能够大幅提升开发效率并降低技术门槛。阿里云通义灵码AI程序员已全面上线,成为全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员产品。此次上线的AI程序员相比传统AI辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,。代码是大模型应用最广泛的场景之一,随着大语言模型能力的不断增强,AI代码工具已从辅助编码升级到面向复杂任务的工程级协同编码。目前,
2025-01-09 23:41:07
1506
原创 【AI编辑器】Cursor与DeepSeek模型的集成:提升开发效率的新选择
通过本文的介绍,我们详细了解了如何将Cursor的模型替换为DeepSeek模型。DeepSeek模型以其卓越的性能和低廉的使用成本,为开发者提供了一种更具经济性和灵活性的选择。配置完成后,我们可以利用DeepSeek模型在Cursor中自动生成代码,提高开发效率。未来,随着AI技术的不断发展,相信会有更多优秀的模型涌现出来,为开发者提供更多的选择和便利。让我们一起期待更加智能、高效的编程时代的到来!
2025-01-04 11:34:45
8538
原创 【brew安装失败】DNS 查询 raw.githubusercontent.com 返回的是 0.0.0.0
从你提供的nslookup输出看,DNS 查询返回的是0.0.0.0,这通常意味着无法解析该域名或该域名被某些 DNS 屏蔽了。
2024-12-31 11:05:19
897
原创 【大模型】wiki中文语料的word2vec模型构建
Word2Vec模型由Google的Tomas Mikolov等人在2013年提出,其目标是通过无监督学习方法将词语映射到一个连续的向量空间,使得相似语义的词语在向量空间中的距离较近。:通过上下文预测当前词语,适用于处理较为常见的单词。Skip-gram:通过当前词语预测上下文,适用于处理较为稀有的单词。这两种方法的核心思想是:如果两个词在文本中经常出现在相似的上下文中,那么它们的向量表示应该彼此接近。基于这一思想,Word2Vec可以捕捉到语义上相似词汇的关系。
2024-12-28 16:12:19
902
原创 【实战分享】构建企业级RAG(Retrieval-Augmented Generation)知识库的全面实践
大模型指的是训练参数量极其庞大的深度学习模型,如GPT-3、GPT-4等。这些模型能够通过海量的数据学习,具备强大的语言理解和生成能力。在问答系统中,大模型能够理解用户提出的问题,并生成相关的回答。"""添加文档向量"""pass"""相似度检索"""pass"""获取页面分段"""passMilvus是一个开源的向量数据库,专为高效的向量存储和检索设计。Milvus支持多种索引方式(如IVF、HNSW等),并提供高效的查询和检索功能。索引构建:Milvus通过创建索引加速查询速度。
2024-12-22 11:19:01
3225
2
原创 【Windsurf】Windsurf:重塑编程未来的AI集成开发环境(IDE)深度解析
Windsurf作为一款新兴的AI辅助编程工具,以其革命性的设计理念和前沿的技术实力,在市场中展现出了强大的竞争力。它不仅在核心技术、功能特性、实际应用场景等方面表现出色,还在与市场上其他同类产品的对比分析中展现出了独特的优势。未来,随着AI技术的不断发展,Windsurf有望进一步提升其智能化水平,为开发者提供更加高效、便捷、直观的编程体验。对于开发者而言,选择适合自己的AI编程工具至关重要。无论是Windsurf还是Cursor,都有其独特的优势和适用场景。
2024-12-12 23:21:49
6771
原创 【V0.dev】AI驱动的用户界面代码生成工具深度解析
V0.dev作为一款基于AI技术的用户界面代码生成工具,以其高效、便捷的开发方式和高质量的代码生成能力赢得了广泛的关注和赞誉。通过本文的介绍和分析,我们可以全面了解V0.dev的各个方面,包括其简介、工作原理与功能、使用技巧、使用体验与案例分析、优势与局限、未来展望以及启发思考等。
2024-12-09 22:56:06
3880
原创 【AI工具】强大的AI编辑器Cursor详细使用教程
近日,由四名麻省理工学院(MIT)本科生共同创立的Anysphere公司宣布,其开发的AI代码编辑器Cursor在成立短短两年内,不仅吸引了全球超过2600万开发者的关注,更是在A轮融资中筹集超过6000万美元,公司估值飙升至4亿美元。这一成就不仅彰显了MIT创新创业的强大实力,也预示着AI代码工具或将成为继AI搜索之后的下一个热门领域。
2024-12-04 22:20:47
12585
2
原创 【Docker】Mac安装Docker Desktop导致磁盘剩余空间较少问题如何解决?
MAC电脑是8+256G,磁盘空间比较少,最近老是爆磁盘提示,于是通过Tencent Lemon做磁盘分析,发现Docker的Containers目录占用磁盘空间巨大,因此需要修改Docker Desktop的设置调小磁盘占用量。在 Mac 上安装 Docker Desktop 后出现磁盘空间不足的问题是常见的,尤其是在使用 Docker 容器和镜像时。特别是清理不再使用的镜像和容器,是一种有效的方法来减少 Docker 对磁盘空间的占用。Docker 使用的磁盘空间很大一部分来自未使用的镜像、容器和卷。
2024-11-12 11:31:27
2148
原创 【AIGC】探索超凡记忆:SuperMemory,你的私人智能书签助手!
SuperMemory 通过一个 Chrome 插件来导入推文、保存网站和内容。这个项目被设计成一个类似于 ChatGPT 的工具,但它专注于你的书签和个人知识库。实测收集的效果回答质量并不高,有些网站插件收集UI还有BUG。
2024-09-10 08:08:24
921
原创 【SpringBoot】自定义spring-boot-starter
定义:Spring Boot 中的 Starter 是 Spring Boot 相对于传统的 Spring 的优势原因之一。Starter 相当于模块,它能将模块所需要的依赖进行整合并对模块内部的 Bean 根据环境进行自动配置。使用者在使用 Spring Boot 中的 Starter 的时候,无需进行过多的配置和依赖,Spring Boot 能进行自动扫描并且为对应的模块设置默认值,做到真正的开箱即用。针对于一些没有封装成 Starter 的依赖,往往经常出现的情况是需要使用者自行进行必要的一些配置。
2024-08-23 08:20:27
1166
原创 【DDD】领域驱动设计概念深入探索
领域驱动设计(DDD)是一种深入业务领域的软件设计方法,它要求开发团队与业务专家紧密合作,共同构建准确反映业务逻辑的领域模型。通过深入理解DDD的核心理念、精细执行关键实践以及深入探索细节处理,我们可以构建出高质量、可维护的软件系统。未来,随着业务领域的不断发展和变化,DDD将继续发挥其重要作用,为软件开发带来更多的价值和挑战。同时,我们也需要不断学习和探索新的技术和方法,以完善和优化DDD的应用实践,为软件开发注入更多的创新和活力。实体映射策略。
2024-07-13 22:31:50
1265
原创 【AIGC】GPT-4深度解析:自然语言处理的新纪元
OpenAI为GPT-4开发了一个开源评估框架,旨在为研究人员和开发人员提供一个标准化的方法来测试和比较不同模型的性能。技术细节框架结构:介绍评估框架的组成元素和工作流程。自定义测试:讨论如何利用框架创建自定义测试来评估特定方面的表现。综上所述,GPT-4作为自然语言处理领域的杰出代表,凭借其庞大的模型规模、卓越的语言生成能力、以及多模态的交互潜力,正引领着AI技术的新一轮变革。
2024-07-11 23:44:12
1326
3
原创 【Redis】三大Redis内存分析工具介绍(Redisinsight、RDR、RMA)
定义:RedisInsight是一个直观且高效的Redis GUI(图形用户界面)管理工具。功能:提供对Redis数据的查询、分析以及与Redis数据库的交互功能。开发者:由Redis Labs开发,并作为Redis的官方可视化工具推出。Redis Data Reveal(简称RDR)是一款用于分析和可视化Redis数据库中每个key占用的内存空间的工具。
2024-06-27 22:54:10
7539
1
原创 【Redis】Redis内存使用优化方法
当优化Redis的内存使用时,可以深入考虑以下几个方面,从配置调整到实际操作细节,全面提升Redis的性能和效率。
2024-06-19 15:52:16
1443
原创 【AIGC】MetaGPT原理以及应用
MetaGPT是一种多智能体框架,它结合了元编程技术,通过标准化操作程序(SOPs)来协调基于大语言模型的多智能体系统。目前,MetaGPT在GitHub上已经收获了40K的star,多次获得GitHub Trending的第一名。其技术论文也在ICLR 2024中获得了oral的机会,并在相关工作中总分第一。这些成绩都证明了MetaGPT在技术和应用上的领先地位。
2024-06-15 17:52:30
1994
1
原创 【Gitlab】Gitlab MAC M1通过Docker Desktop安装教程
32行# external_url 'http://192.168.1.222' #配置ssh协议所使用的访问地址和端口。66行# gitlab_rails['gitlab_ssh_host'] = '192.168.1.222'650行# gitlab_rails['gitlab_shell_ssh_port'] = 8822。#配置http协议所使用的访问地址,填写宿主机映射端口,不加端口号默认为80;如下,在external_url后面配置gitlab的访问url。点击run,弹出以下界面,配置。
2024-06-09 08:26:18
1804
1
原创 【AIGC】基于大模型+知识库的Code Review实践
基于大模型与知识库的Code Review实践,具体实施细节可以归纳如下:一、选择合适的大模型与知识库二、集成大模型与知识库到Code Review流程三、结合人工审查四、持续优化与改进通过以上具体实施细节,可以确保基于大模型与知识库的Code Review实践能够高效、准确地评估代码的质量和可靠性,提高开发效率。
2024-06-08 16:15:14
5760
11
原创 【大模型】Ollama+open-webui/Anything LLM部署本地大模型构建RAG个人知识库教程(Mac)
如果需要,可以使用AnythingLLM的开发者API进行自定义集成,以满足特定的业务需求。
2024-06-05 09:07:41
17869
9
原创 【前端】Mac安装node14教程
使用Node Version Manager (nvm)安装Node.js。以上命令将会安装Node.js 14.x的最新稳定版本。如果需要特定的14.x版本,可以使用。替换为特定的小版本号。
2024-05-31 23:03:24
2031
原创 【百度地图】通过IP获取地区,百度地图城市代码获取
343,黔西南布依族苗族自治州。84,克孜勒苏柯尔克孜自治州。107,红河哈尼族彝族自治州。116,德宏傣族景颇族自治州。274,湘西土家族苗族自治州。306,黔南布依族苗族自治州。342,黔东南苗族侗族自治州。373,恩施土家族苗族自治州。65,海西蒙古族藏族自治州。109,西双版纳傣族自治州。177,文山壮族苗族自治州。185,阿坝藏族羌族自治州。86,巴音郭楞蒙古自治州。88,博尔塔拉蒙古自治州。113,怒江傈僳族自治州。1642,昌江黎族自治县。1643,陵水黎族自治县。2032,乐东黎族自治县。
2024-04-28 17:33:31
1745
原创 【Sqoop教程】Sqoop学习教程以相关资料
当使用Sqoop进行数据传输时,以下是更详细的步骤和示例:### 步骤1:安装和配置Sqoop1. 下载Sqoop并解压缩到指定目录。2. 配置`sqoop-env-template.sh`文件,设置JAVA_HOME、HADOOP_COMMON_HOME等环境变量,并另存为`sqoop-env.sh`。3. 配置`sqoop-site-template.xml`文件,设置数据库连接信息等,并另存为`sqoop-site.xml`。### 步骤2:连接到关系型数据库。
2024-03-22 17:50:11
1409
1
原创 【文件处理】Tika获得文件类型以及后缀
可以使用 Apache Tika 来获取文件类型,并使用 `getDefaultMimeTypes()` 方法来获取文件后缀。在这个示例中,我们创建了一个 `File` 对象并指定了文件路径。然后,我们使用 Apache Tika 的 `Tika` 类来检测文件类型,并使用 `detect()` 方法获取文件的正确类型。
2024-02-02 15:27:37
1110
原创 【前端部署】前端Vue部署正式环境部署上线流程
将 Vue 项目部署到线上,通常需要经过以下步骤:1. **本地开发和测试:**- 确保您的本地开发环境已经安装了 Node.js 和 npm。- 在命令行中进入您的 Vue 项目目录,并运行以下命令安装项目依赖:```bash```- 完成依赖安装后,可以使用以下命令在本地启动开发服务器进行测试:```bash```- 打开浏览器并访问 `http://localhost:8080`(默认端口号为8080),确保项目能够正常运行,并进行功能测试和调试。
2023-12-26 11:01:03
3343
原创 【Log4j2】Log4j2最佳实践:Log4j2配置超过7天压缩,超过3个月删除文件的滚动日志,分别定义info文件和error文件,按照每小时存储
如果你想要在控制台输出美化的日志信息,你可以使用Log4j2的ConsoleAppender和AnsiColorConverter来实现。在这个配置中,我们新增了一个Console appender(ConsoleAppender),用于在控制台输出美化的日志信息。使用PatternLayout的`%highlight{}`和AnsiColorConverter可以根据日志级别为日志信息添加颜色。在示例配置中,我们为不同的日志级别设置了不同的颜色。
2023-12-26 00:03:49
5486
原创 【JDK新特性】JDK和Springboot各版本新特性介绍
以下是一些较新版本的JDK的主要新特性介绍:java.timevarjavaswitchteeing()switchswitchswitchrecordnullnullswitchRecordsinstanceof当然,下面是一些较新版本的 Spring Boot 的主要特性介绍:这些是一些主要的 Spring Boot 版本的特性介绍,每个版本都有更多的改进和新增功能。您可以查阅官方文档以获取更详细的信息。
2023-12-25 22:37:56
1629
原创 【大语言模型】Transformer原理以及运行机制
当谈到Transformer模型的原理和运行机制时,以下是更详细的解释:总结:Transformer模型通过自注意力机制和堆叠的多层网络,能够学习到全局依赖关系和上下文信息,从而提高了自然语言处理任务的性能和效果。它具有并行计算的能力,在处理长序列任务时表现出色,并且可以通过调整模型的深度和宽度来适应不同的任务和数据集。
2023-12-24 09:18:30
2115
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人