自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不积跬步,无以至千里;不积小流,无以成江海。

而世之奇伟、瑰怪、非常之观,常在于险远,而人之所罕至焉,故非有志者不能至也。尽吾志也而不能至者,可以无悔矣,其孰能讥之乎?

  • 博客(578)
  • 资源 (6)
  • 收藏
  • 关注

原创 ChatGPT 优缺点对比

它可能会给出看似真实但实际上是错误或伪造的答案,因此在应用中需要谨慎使用,尤其是涉及到重要或敏感的信息。:ChatGPT是通过对大量的互联网文本进行训练而得到的,它从多个领域的数据中学习知识和语言模式。:OpenAI不断致力于改进ChatGPT的性能和功能,以提供更准确、有用和安全的回答。:ChatGPT具有灵活的架构,可以根据用户的输入进行迭代和调整。它可以通过上下文理解和记忆先前的对话,以便更好地回应用户的需求。它可以根据不同的用例提供准确的回答和解决方案。

2023-07-10 14:54:41 12300 13

原创 Gin 框架中集成 runtime/debug 打印日志堆栈信息

在 Gin 框架中,你可以使用 runtime/debug 包来打印调试信息,特别是在错误处理和日志记录方面。是 Go 标准库中一个用于调试和诊断的包,提供了多种功能来帮助开发者分析程序运行状态、排查问题以及优化性能。os.Stderr[]byterecoverpanicAllocTotalAllocSysNumGCMain.PathDeps通过合理使用,可以显著提升 Go 程序的调试效率和运行稳定性。

2025-04-27 10:38:45 362

原创 还在到处找MCP资源?这11个MCP资源库收好!

2024年年底,Anthropic提出并开源的MCP(Model Context Protocol),如今已成为AI编程及AI Agent领域的热门概念。不少小伙伴在后台询问MCP资源,今天就为大家整理了11个实用的MCP资源库,涵盖服务器托管、客户端工具、社区交流等多个方面,一起来看看吧!

2025-04-23 17:14:18 500

原创 基于百度地图 MCP Server规划规划一次青岛到北京旅行的详细行程实践

百度地图API现已全面兼容,是国内首家兼容MCP协议的地图服务商。百度地图提供的MCP Server,包含10个符合MCP协议标准的API接口,涵盖逆地理编码、地点检索、路线规划等。依赖和开发,任意支持MCP协议的智能体助手(如ClaudeCursor以及等)都可以快速接入。

2025-04-23 16:48:20 676

原创 Go语言之sync包 WaitGroup的使用和底层实现

在 Go 语言里,sync 包中的 WaitGroup 是一个实用工具,用于等待一组 goroutine 完成任务。其核心原理是通过内部维护一个计数器,该计数器初始值为 0,每启动一个新的 goroutine 就将计数器加 1,每个 goroutine 完成任务后会将计数器减 1,当计数器变为 0 时,意味着所有 goroutine 都已完成任务。下面为你展示WaitGroup。

2025-04-22 22:30:00 377

原创 etcd 的安装使用

etcd是一个开源的分布式键值存储系统,主要用于共享配置和服务发现,在分布式系统中扮演着重要的角色。

2025-04-14 15:09:33 428

原创 Server-Sent Events一种允许服务器向客户端发送实时更新的 Web API

Server-Sent Events(SSE)是一种允许服务器向客户端发送实时更新的 Web API。它基于 HTTP 协议,提供了一种单向的、服务器到客户端的通信机制,客户端可以通过监听服务器发送的事件来接收实时数据。下面从原理、使用场景、代码示例等方面进行详细介绍。

2025-04-10 21:45:00 1625

原创 AI 大模型的标准化工具箱MCP (Model Context Protocol)

MCP (Model Context Protocol,模型上下文协议)定义了应用程序和 AI 模型之间交换上下文信息的方式。这使得开发者能够以一致的方式将各种数据源、工具和功能连接到 AI 模型(一个中间协议层),就像 USB-C 让不同设备能够通过相同的接口连接一样。MCP 的目标是创建一个通用标准,使 AI 应用程序的开发和集成变得更加简单和统一。

2025-04-10 14:10:48 1028

原创 LangChain使用大语言模型构建强大的应用程序

LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。

2025-04-09 20:58:32 759

原创 golang 中 make 和 new 的区别?

Go语言中,`make` 和 `new` 都是用于内存分配的关键字,但它们在使用场景、返回值和初始化方式等方面存在一些区别

2025-04-08 14:55:43 343

原创 golang 性能优化分析工具 pprof

pprof是 Go 语言开发中不可或缺的性能分析工具,它能帮助开发者深入了解程序的性能瓶颈,从而有针对性地进行优化,提高程序的性能和稳定性。

2025-04-08 11:36:42 885

原创 ComfyUI的本地私有化部署使用Stable Diffusion文生图

ComfyUI是一个基于节点流程的Stable Diffusion操作界面。

2025-04-06 16:27:32 950

原创 chromadb 安装和使用

Chromadb 是一个开源的嵌入式向量数据库,专为现代人工智能和机器学习应用设计,旨在高效存储、检索和管理向量数据。

2025-04-06 12:44:26 646

原创 如何选择RAG的Embedding模型?

中文模型:bge-large-zh-v1.5, multilingual-e5-large, bce-embedding-base_v1,m3e-base,acge_text_embedding。最近在学习RAG技术,遇到了一个关于如何选择合适的Embedding模型的问题。如果你去搜索Embedding模型,你会发现现在有很多的Embedding模型,那么该如何来选择这种模型呢?大系列有:bge, jina, gte, bce, e5, m3e。既包含开源,也包含API,鱼目混杂,需要进一步验证和确认。

2025-04-06 11:06:28 700

原创 ollama 部署nomic-embed-text 模型和使用,计算句子相似度

nomic -embed-text是一个基于Sentence Transformers库的句子嵌入模型,主要用于特征提取和句子相似度计算。nomic-embed-text 是一款强大的文本嵌入工具,其高性能和灵活性使其成为处理复杂文本任务的理想选择,在学术研究和商业应用等领域都能为用户提供有力的技术支持。

2025-04-06 10:34:00 322

原创 RAGFlow:基于OCR和文档解析的下一代 RAG 引擎

RAGFlow是一款基于深度文档理解构建的开源RAG(检索增强生成)引擎。

2025-04-05 20:25:42 760

原创 Qwen-7B-Chat 本地化部署使用

【代码】Qwen-7B-Chat 本地化部署使用。

2025-04-05 19:51:58 729

原创 Fastapi访问本地/docs和/redoc接口文档

使用fastapi的时候,swagger-ui.css 、swagger-ui-bundle.js、redoc.standalone.js 有时候无法加载(国内环境原因或者是局域网屏蔽),此时就需要自己用魔法下载好对应文件,然后替换到fastapi里面去。

2025-04-05 16:34:57 206

原创 大模型快速 ASGI 服务器uvicorn

Uvicorn 是一个基于 Python 的快速 ASGI(异步服务器网关接口)服务器。它的主要作用是作为 Web 应用程序的服务器,负责接收客户端的请求,并将请求传递给应用程序处理,然后将应用程序的响应返回给客户端。由于采用异步编程模型,它能高效处理大量并发请求,提升应用程序的性能和响应速度。

2025-04-05 11:57:18 784

原创 docker-compose安装单节点milvus

docker-compose安装单节点milvus。

2025-04-02 22:15:00 121

原创 分布式锁方案-Redisson

分布式锁:Redisson还实现了Redis文档中提到像分布式锁Lock这样的更高阶应用场景。事实上Redisson并没有不止步于此,在分布式锁的基础上还提供了联锁(MultiLock),读写锁(ReadWriteLock),公平锁(Fair Lock),红锁(RedLock),信号量(Semaphore),可过期性信号量(PermitExpirableSemaphore)和闭锁(CountDownLatch)这些实际当中对多线程高并发应用至关重要的基本部件。

2025-04-02 18:05:24 336

原创 什么是 Milvus?GPU加速向量数据库

向量数据库是专门设计用于通过向量嵌入和数值表示来管理和检索非结构化数据的系统,这些表示捕捉了图像、音频、视频和文本内容等数据项的本质。与处理结构化数据并执行精确搜索操作的传统关系数据库不同,向量数据库擅长使用 Approximate Nearest Neighbor(ANN)算法等技术进行语义相似性搜索。这种能力对于开发推荐系统、聊天机器人和多媒体内容搜索工具等各种领域的应用程序,以及解决 ChatGPT 等大型语言模型和 AI 带来的挑战(如理解上下文和细微差别以及 AI 幻觉)至关重要。

2025-04-02 09:20:41 785

原创 大模型RAG使用sentence_transformers将文档存入向量数据库 pgvector

使用 `sentence_transformers` 库将文本转换为向量,并将这些向量存储到使用 `pgvector` 扩展的 PostgreSQL 数据库中,你可以按以下步骤操作。

2025-03-30 17:42:35 510

原创 RAG 文档嵌入到向量数据库FAISS

文档嵌入(Embedding)是将文本数据转换为向量的过程。这一过程的核心是使用一个预训练的嵌入模型(如 OpenAI 的 text-embedding-ada-002,或 BERT、SentenceTransformers 等)将文本映射到一个高维向量空间中。相似的文本在该空间中的距离较近,而不相关的文本距离较远。

2025-03-30 17:31:51 296

原创 LLM的RAG 解决大模型的幻觉问题

LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。正是在这样的背景下,检索增强生成技术(Retrieval-Augmented Generation,RAG)应时而生,成为 AI 时代的一大趋势。RAG 通过在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程,极大地提升了内容的准确性和相关性。

2025-03-30 11:33:58 285

原创 Embedding 模型介绍与实践

嵌入模型是一种复杂的特征学习方法,它将高维数据编码到低维向量空间中。这些表示通过保留关键关系和语义信息,可以更容易地操纵和分析数据。通过将复杂的数据类型转换为向量,嵌入模型可以发现模式并建立有意义的连接。

2025-03-30 10:59:44 342

原创 AI Agent 实战:搭建个人在线旅游助手

本次实验中,我们将继续探索 Agent 的提示词,学习更加规范的提示词撰写方法。

2025-03-30 10:10:03 1521

原创 什么是 LLMOps?

LLMOps 是一个涵盖了大型语言模型(如GPT系列)开发、部署、维护和优化的一整套实践和流程。LLMOps 的目标是确保高效、可扩展和安全地使用这些强大的 AI 模型来构建和运行实际应用程序。它涉及到模型训练、部署、监控、更新、安全性和合规性等方面。

2025-03-30 10:04:44 897

原创 Spring Boot 自动配置原理?

Spring Boot自动配置的原理就是通过注解开启自动配置功能,利用类从文件中加载自动配置类,并根据排除条件和条件注解进行筛选,最后将符合条件的自动配置类中的Bean注册到Spring容器中。这样,开发者只需要添加相应的依赖,Spring Boot就会自动完成大部分的配置工作。

2025-03-30 00:30:00 311

原创 RAG、大模型与智能体的关系

一句话总结:RAG(中文为检索增强生成) = 检索技术 + LLM 提示。

2025-03-29 21:54:06 584

原创 LLaMA-Factory 零代码轻松微调百余种大模型

LLaMA-Factory 是开发者在资源有限条件下微调LLMs的利器,通过LoRA和量化技术平衡性能与效率,适用于学术研究、企业应用快速落地及边缘设备部署。LoRA(Low-Rank Adaptation)**技术优化,旨在以极低的计算和存储成本实现模型定制化。LaMA-Factory 是一个专为**高效微调大型语言模型(LLMs)

2025-03-29 21:01:16 272

原创 LoRA 模型微调框架核心原理及实现步骤

LoRA(Low-Rank Adaptation)模型微调框架通过低秩矩阵分解原理,实现了对大型预训练模型的高效微调。通过以上步骤,LoRA框架能够在保持模型性能的同时,显著降低微调成本和计算资源需求,成为资源受限场景下的首选方案。

2025-03-29 19:36:27 601

原创 MDC的原理是什么?

MDC 的原理是借助为每个线程提供独立的上下文存储,允许在日志记录时引用这些上下文信息,从而在多线程环境下为日志添加额外的诊断信息。

2025-03-27 17:00:35 405

原创 linux 的免密切换用户PAM配置

PAM是一种用于管理系统认证的机制,它允许系统管理员灵活地配置不同服务的认证方式和策略。文件专门用于定义当用户使用su命令切换用户身份时的认证规则和流程。例如,它可以指定是否允许无密码切换、限制某些用户的切换权限等。

2025-03-12 22:15:00 265

原创 sacct 常用命令《Slurm》

通过合理使用sacct命令,用户可以方便地查看和管理自己的历史作业信息,从而更好地利用SLURM作业管理系统进行资源调度和作业管理。sacct是SLURM作业管理系统中用于查看历史作业信息的命令。

2025-03-03 21:45:00 266

原创 linux 命令getent 的使用指南

getent是一个用于在 Linux 和其他类 Unix 操作系统中从系统数据库中获取条目的命令行工具。系统数据库可以包括用户账户信息、组信息、主机名、服务信息等等。getent命令通过查询这些数据库来提供关于系统配置的信息,而无需直接读取配置文件。

2025-02-28 21:01:04 516

原创 Locust性能压测工具使用指南

Locust性能压测工具使用指南。

2025-02-27 22:00:00 663

原创 Nginx错误:nginx: [error] invalid PID number ““ in “/usr/local/nginx/logs/nginx.pid“

nginx: [error] invalid PID number "" in "/usr/local/nginx/logs/nginx.pid" usr/local/nginx/logs/nginx.pid 中没有进程号导致。

2025-02-20 21:45:00 309

原创 Spring Boot 中加载多个 YAML 配置文件

Spring Boot 提供了多种方法来加载多个 YAML 配置文件,选择哪种方法取决于你的具体需求和应用场景。无论是使用、profiles、还是,都可以帮助你有效地管理和加载配置信息。

2025-02-12 00:00:00 829 1

原创 deepseek大模型本地私有化部署开发最全文档

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

2025-02-09 21:45:00 759

ycsb-mongodb

YCSB(Yahoo Cloud Serving Benchmark)是一个开源的性能测试框架,用于评估分布式系统的读写性能。它具有以下优点和缺点: 优点: 简单易用:YCSB提供了简单的API和配置文件,使得性能测试非常容易上手和执行。 可扩展性:YCSB支持多种数据库和存储系统,包括关系型数据库、NoSQL数据库、分布式文件系统等,使得测试可以针对不同的系统进行比较和评估。 客户端压力:YCSB可以模拟大量并发用户并提供各种负载测试模式,可以测试系统在高负载情况下的性能表现。 可自定义:YCSB允许用户通过自定义操作和负载生成器来模拟真实场景的读写操作,并能够根据需求进行灵活的性能测试。 缺点: 功能有限:YCSB主要关注系统的读写性能,但对于其他方面的测试,如连接池管理、事务处理等功能则不够全面。 没有细粒度监控:YCSB提供一些基本的指标和报告,但对于系统内部的细粒度监控和分析能力较弱,无法对系统的具体瓶颈进行深入探究。 侧重点不同:YCSB主要关注于基准性能,对于系统的可用性、容错性等方面的测试则相对较少。 综上所述,YCSB作为一个简单易用的性能测试框架,能够有效评估

2024-01-18

DmJdbcDriver

DM8达梦8数据库安装包驱动包,国产数据库达梦8 dm8 jdbc 驱动可以在达梦8数据库安装包里面的driver文件夹中获取 达梦8JDBC驱动分为DmJdbcDriver15、DmJdbcDriver16、DmJdbcDriver17、DmJdbcDriver18,分别对应Jdk1.5、Jdk1.6、Jdk1.7、Jdk1.8; 达梦数据库管理系统是达梦公司推出的具有完全自主知识产权的高性能数据库管理系统,简称DM,它具有如下特点: 1、通用性 达梦数据库管理系统兼容多种硬件体系,可运行于X86、X64、SPARC、POWER等硬件体系之上。DM各种平台上的数据存储结构和消息通信结构完全一致,使得DM各种组件在不同的硬件平台上具有一致的使用特性。 达梦数据库管理系统产品实现了平台无关性,支持Windows系列、各版本Linux(2.4及2.4以上内核)、Unix、Kylin、AIX、Solaris等各种主流操作系统。达梦数据库的服务器、接口程序和管理工具均可在32位/64 位版本操作系统上使用。 2、高性能 支持列存储、数据压缩、物化视图等面向联机事务分析场景的优化选项

2023-02-27

使用 febootstrap 制作自定义基础镜像

使用 febootstrap 制作自定义基础镜像

2022-05-13

mha4mysql-centos7

MHA Manager 0.56 rpm RHEL6 MHA Node 0.56 rpm RHEL6

2022-04-21

mybatis-generator.zip

mybatis-generator自动生成代码工具 1.能够生成PO类,能生成mapper映射文件(其中包括基本的增删改查功能)、能生成mapper接口。 2.这可是省了很多功夫,即使你要做些修改,添加下自己需要的功能或删除自己不需要的功能。

2020-02-29

noVNC-1.0.0.tar.gz

noVNC 是一个 HTML5 VNC 客户端,采用 HTML 5 WebSockets, Canvas 和 JavaScript 实现,noVNC 被普遍用在各大云计算、虚拟机控制面板中,比如 OpenStack Dashboard 和 OpenNebula Sunstone 都用的是 noVNC。

2019-09-27

WebService调用代码样例

WebService调用代码样例

2017-08-11

gson-2.2.4.jar

gson-2.2.4.jar

2015-12-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除