- 博客(578)
- 资源 (6)
- 收藏
- 关注

原创 ChatGPT 优缺点对比
它可能会给出看似真实但实际上是错误或伪造的答案,因此在应用中需要谨慎使用,尤其是涉及到重要或敏感的信息。:ChatGPT是通过对大量的互联网文本进行训练而得到的,它从多个领域的数据中学习知识和语言模式。:OpenAI不断致力于改进ChatGPT的性能和功能,以提供更准确、有用和安全的回答。:ChatGPT具有灵活的架构,可以根据用户的输入进行迭代和调整。它可以通过上下文理解和记忆先前的对话,以便更好地回应用户的需求。它可以根据不同的用例提供准确的回答和解决方案。
2023-07-10 14:54:41
12300
13
原创 Gin 框架中集成 runtime/debug 打印日志堆栈信息
在 Gin 框架中,你可以使用 runtime/debug 包来打印调试信息,特别是在错误处理和日志记录方面。是 Go 标准库中一个用于调试和诊断的包,提供了多种功能来帮助开发者分析程序运行状态、排查问题以及优化性能。os.Stderr[]byterecoverpanicAllocTotalAllocSysNumGCMain.PathDeps通过合理使用,可以显著提升 Go 程序的调试效率和运行稳定性。
2025-04-27 10:38:45
362
原创 还在到处找MCP资源?这11个MCP资源库收好!
2024年年底,Anthropic提出并开源的MCP(Model Context Protocol),如今已成为AI编程及AI Agent领域的热门概念。不少小伙伴在后台询问MCP资源,今天就为大家整理了11个实用的MCP资源库,涵盖服务器托管、客户端工具、社区交流等多个方面,一起来看看吧!
2025-04-23 17:14:18
500
原创 基于百度地图 MCP Server规划规划一次青岛到北京旅行的详细行程实践
百度地图API现已全面兼容,是国内首家兼容MCP协议的地图服务商。百度地图提供的MCP Server,包含10个符合MCP协议标准的API接口,涵盖逆地理编码、地点检索、路线规划等。依赖和开发,任意支持MCP协议的智能体助手(如ClaudeCursor以及等)都可以快速接入。
2025-04-23 16:48:20
676
原创 Go语言之sync包 WaitGroup的使用和底层实现
在 Go 语言里,sync 包中的 WaitGroup 是一个实用工具,用于等待一组 goroutine 完成任务。其核心原理是通过内部维护一个计数器,该计数器初始值为 0,每启动一个新的 goroutine 就将计数器加 1,每个 goroutine 完成任务后会将计数器减 1,当计数器变为 0 时,意味着所有 goroutine 都已完成任务。下面为你展示WaitGroup。
2025-04-22 22:30:00
377
原创 Server-Sent Events一种允许服务器向客户端发送实时更新的 Web API
Server-Sent Events(SSE)是一种允许服务器向客户端发送实时更新的 Web API。它基于 HTTP 协议,提供了一种单向的、服务器到客户端的通信机制,客户端可以通过监听服务器发送的事件来接收实时数据。下面从原理、使用场景、代码示例等方面进行详细介绍。
2025-04-10 21:45:00
1625
原创 AI 大模型的标准化工具箱MCP (Model Context Protocol)
MCP (Model Context Protocol,模型上下文协议)定义了应用程序和 AI 模型之间交换上下文信息的方式。这使得开发者能够以一致的方式将各种数据源、工具和功能连接到 AI 模型(一个中间协议层),就像 USB-C 让不同设备能够通过相同的接口连接一样。MCP 的目标是创建一个通用标准,使 AI 应用程序的开发和集成变得更加简单和统一。
2025-04-10 14:10:48
1028
原创 LangChain使用大语言模型构建强大的应用程序
LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。
2025-04-09 20:58:32
759
原创 golang 中 make 和 new 的区别?
Go语言中,`make` 和 `new` 都是用于内存分配的关键字,但它们在使用场景、返回值和初始化方式等方面存在一些区别
2025-04-08 14:55:43
343
原创 golang 性能优化分析工具 pprof
pprof是 Go 语言开发中不可或缺的性能分析工具,它能帮助开发者深入了解程序的性能瓶颈,从而有针对性地进行优化,提高程序的性能和稳定性。
2025-04-08 11:36:42
885
原创 ComfyUI的本地私有化部署使用Stable Diffusion文生图
ComfyUI是一个基于节点流程的Stable Diffusion操作界面。
2025-04-06 16:27:32
950
原创 chromadb 安装和使用
Chromadb 是一个开源的嵌入式向量数据库,专为现代人工智能和机器学习应用设计,旨在高效存储、检索和管理向量数据。
2025-04-06 12:44:26
646
原创 如何选择RAG的Embedding模型?
中文模型:bge-large-zh-v1.5, multilingual-e5-large, bce-embedding-base_v1,m3e-base,acge_text_embedding。最近在学习RAG技术,遇到了一个关于如何选择合适的Embedding模型的问题。如果你去搜索Embedding模型,你会发现现在有很多的Embedding模型,那么该如何来选择这种模型呢?大系列有:bge, jina, gte, bce, e5, m3e。既包含开源,也包含API,鱼目混杂,需要进一步验证和确认。
2025-04-06 11:06:28
700
原创 ollama 部署nomic-embed-text 模型和使用,计算句子相似度
nomic -embed-text是一个基于Sentence Transformers库的句子嵌入模型,主要用于特征提取和句子相似度计算。nomic-embed-text 是一款强大的文本嵌入工具,其高性能和灵活性使其成为处理复杂文本任务的理想选择,在学术研究和商业应用等领域都能为用户提供有力的技术支持。
2025-04-06 10:34:00
322
原创 Fastapi访问本地/docs和/redoc接口文档
使用fastapi的时候,swagger-ui.css 、swagger-ui-bundle.js、redoc.standalone.js 有时候无法加载(国内环境原因或者是局域网屏蔽),此时就需要自己用魔法下载好对应文件,然后替换到fastapi里面去。
2025-04-05 16:34:57
206
原创 大模型快速 ASGI 服务器uvicorn
Uvicorn 是一个基于 Python 的快速 ASGI(异步服务器网关接口)服务器。它的主要作用是作为 Web 应用程序的服务器,负责接收客户端的请求,并将请求传递给应用程序处理,然后将应用程序的响应返回给客户端。由于采用异步编程模型,它能高效处理大量并发请求,提升应用程序的性能和响应速度。
2025-04-05 11:57:18
784
原创 分布式锁方案-Redisson
分布式锁:Redisson还实现了Redis文档中提到像分布式锁Lock这样的更高阶应用场景。事实上Redisson并没有不止步于此,在分布式锁的基础上还提供了联锁(MultiLock),读写锁(ReadWriteLock),公平锁(Fair Lock),红锁(RedLock),信号量(Semaphore),可过期性信号量(PermitExpirableSemaphore)和闭锁(CountDownLatch)这些实际当中对多线程高并发应用至关重要的基本部件。
2025-04-02 18:05:24
336
原创 什么是 Milvus?GPU加速向量数据库
向量数据库是专门设计用于通过向量嵌入和数值表示来管理和检索非结构化数据的系统,这些表示捕捉了图像、音频、视频和文本内容等数据项的本质。与处理结构化数据并执行精确搜索操作的传统关系数据库不同,向量数据库擅长使用 Approximate Nearest Neighbor(ANN)算法等技术进行语义相似性搜索。这种能力对于开发推荐系统、聊天机器人和多媒体内容搜索工具等各种领域的应用程序,以及解决 ChatGPT 等大型语言模型和 AI 带来的挑战(如理解上下文和细微差别以及 AI 幻觉)至关重要。
2025-04-02 09:20:41
785
原创 大模型RAG使用sentence_transformers将文档存入向量数据库 pgvector
使用 `sentence_transformers` 库将文本转换为向量,并将这些向量存储到使用 `pgvector` 扩展的 PostgreSQL 数据库中,你可以按以下步骤操作。
2025-03-30 17:42:35
510
原创 RAG 文档嵌入到向量数据库FAISS
文档嵌入(Embedding)是将文本数据转换为向量的过程。这一过程的核心是使用一个预训练的嵌入模型(如 OpenAI 的 text-embedding-ada-002,或 BERT、SentenceTransformers 等)将文本映射到一个高维向量空间中。相似的文本在该空间中的距离较近,而不相关的文本距离较远。
2025-03-30 17:31:51
296
原创 LLM的RAG 解决大模型的幻觉问题
LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。正是在这样的背景下,检索增强生成技术(Retrieval-Augmented Generation,RAG)应时而生,成为 AI 时代的一大趋势。RAG 通过在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程,极大地提升了内容的准确性和相关性。
2025-03-30 11:33:58
285
原创 Embedding 模型介绍与实践
嵌入模型是一种复杂的特征学习方法,它将高维数据编码到低维向量空间中。这些表示通过保留关键关系和语义信息,可以更容易地操纵和分析数据。通过将复杂的数据类型转换为向量,嵌入模型可以发现模式并建立有意义的连接。
2025-03-30 10:59:44
342
原创 什么是 LLMOps?
LLMOps 是一个涵盖了大型语言模型(如GPT系列)开发、部署、维护和优化的一整套实践和流程。LLMOps 的目标是确保高效、可扩展和安全地使用这些强大的 AI 模型来构建和运行实际应用程序。它涉及到模型训练、部署、监控、更新、安全性和合规性等方面。
2025-03-30 10:04:44
897
原创 Spring Boot 自动配置原理?
Spring Boot自动配置的原理就是通过注解开启自动配置功能,利用类从文件中加载自动配置类,并根据排除条件和条件注解进行筛选,最后将符合条件的自动配置类中的Bean注册到Spring容器中。这样,开发者只需要添加相应的依赖,Spring Boot就会自动完成大部分的配置工作。
2025-03-30 00:30:00
311
原创 LLaMA-Factory 零代码轻松微调百余种大模型
LLaMA-Factory 是开发者在资源有限条件下微调LLMs的利器,通过LoRA和量化技术平衡性能与效率,适用于学术研究、企业应用快速落地及边缘设备部署。LoRA(Low-Rank Adaptation)**技术优化,旨在以极低的计算和存储成本实现模型定制化。LaMA-Factory 是一个专为**高效微调大型语言模型(LLMs)
2025-03-29 21:01:16
272
原创 LoRA 模型微调框架核心原理及实现步骤
LoRA(Low-Rank Adaptation)模型微调框架通过低秩矩阵分解原理,实现了对大型预训练模型的高效微调。通过以上步骤,LoRA框架能够在保持模型性能的同时,显著降低微调成本和计算资源需求,成为资源受限场景下的首选方案。
2025-03-29 19:36:27
601
原创 MDC的原理是什么?
MDC 的原理是借助为每个线程提供独立的上下文存储,允许在日志记录时引用这些上下文信息,从而在多线程环境下为日志添加额外的诊断信息。
2025-03-27 17:00:35
405
原创 linux 的免密切换用户PAM配置
PAM是一种用于管理系统认证的机制,它允许系统管理员灵活地配置不同服务的认证方式和策略。文件专门用于定义当用户使用su命令切换用户身份时的认证规则和流程。例如,它可以指定是否允许无密码切换、限制某些用户的切换权限等。
2025-03-12 22:15:00
265
原创 sacct 常用命令《Slurm》
通过合理使用sacct命令,用户可以方便地查看和管理自己的历史作业信息,从而更好地利用SLURM作业管理系统进行资源调度和作业管理。sacct是SLURM作业管理系统中用于查看历史作业信息的命令。
2025-03-03 21:45:00
266
原创 linux 命令getent 的使用指南
getent是一个用于在 Linux 和其他类 Unix 操作系统中从系统数据库中获取条目的命令行工具。系统数据库可以包括用户账户信息、组信息、主机名、服务信息等等。getent命令通过查询这些数据库来提供关于系统配置的信息,而无需直接读取配置文件。
2025-02-28 21:01:04
516
原创 Nginx错误:nginx: [error] invalid PID number ““ in “/usr/local/nginx/logs/nginx.pid“
nginx: [error] invalid PID number "" in "/usr/local/nginx/logs/nginx.pid" usr/local/nginx/logs/nginx.pid 中没有进程号导致。
2025-02-20 21:45:00
309
原创 Spring Boot 中加载多个 YAML 配置文件
Spring Boot 提供了多种方法来加载多个 YAML 配置文件,选择哪种方法取决于你的具体需求和应用场景。无论是使用、profiles、还是,都可以帮助你有效地管理和加载配置信息。
2025-02-12 00:00:00
829
1
原创 deepseek大模型本地私有化部署开发最全文档
DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。
2025-02-09 21:45:00
759
ycsb-mongodb
2024-01-18
DmJdbcDriver
2023-02-27
mybatis-generator.zip
2020-02-29
noVNC-1.0.0.tar.gz
2019-09-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人