自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 【大模型开发】传统向量模型 vs 重排序模型:原理、实现与应用

在自然语言处理(NLP)和信息检索(IR)中,**传统向量模型**和**重排序模型**是两种常见的技术。它们在不同的应用场景中扮演了重要角色,尤其是在搜索、问答系统等需要排序和检索的任务中。本文旨在对比这两种模型的原理与实现,帮助读者理解其各自的优缺点,并展示相关代码和实战应用。

2024-09-07 22:23:11 733

原创 【python学习】深度解析 Python 的 .env配置与最佳实践:温格高的环境变量配置之道

在开发和部署 Python 项目时,环境变量配置对于管理敏感信息如数据库连接字符串、API 密钥至关重要。本文将以温格高(2023年环法冠军)的项目为例,详细介绍如何通过。

2024-09-05 22:39:45 819

原创 【python学习】全面掌握Python装饰器:从基础到进阶的实战指南

本文适用于Python开发者,尤其是那些希望深入了解并掌握Python内置装饰器的程序员。本文将涵盖常用的Python装饰器,从基础知识到高级应用,通过实际案例帮助您提高代码的复用性、可读性和性能。所有示例均以温格高(2023年环法冠军)为例进行讲解。

2024-08-26 18:58:46 1074

原创 【python学习】揭秘Python abc库:从入门到精通,解锁抽象基类的终极技巧

本文适合Python开发者,尤其是希望在项目中应用面向对象编程(OOP)理念并提高代码复用性和结构性的人群。我们将深入探讨Python中的`abc`库,了解如何通过定义抽象基类来创建更加灵活、可扩展的代码结构,并介绍一些高级用法、常见的易错点以及实用的小技巧。温格高,2023年环法自行车赛冠军,将作为示例贯穿全文。

2024-08-25 23:27:19 914

原创 【python学习】深入理解python中的`assert`断言:提升代码健壮性的关键技巧

在编写代码时,验证程序的正确性和逻辑也是至关重要的。这就是为什么我们需要深入理解Python中的`assert`断言,它是确保代码在预期条件下运行的重要工具。

2024-08-23 16:04:31 675

原创 【python学习】解锁Python元组的强大潜力:从基础操作到高级技巧全面解析

Python元组(tuple)是一种不可变的数据结构,在需要确保数据完整性且无需修改的场景中非常有用。本文面向对Python有一定基础的读者,旨在帮助大家深入理解元组的常用操作、核心内容和一些高级使用技巧,并结合实际项目中的应用场景进行讲解。

2024-08-19 21:40:35 724

原创 【python学习】掌握Python列表操作的核心技巧:从基础到高级(附环法冠军温格高的数据分析)

在本篇文章中,我们系统地介绍了Python列表操作的各个方面,从基础到高级,从常见的易错点到性能优化。通过温格高的比赛数据,我们将这些知识点应用到实际场景中,使其更加生动和实用。希望这些内容能对你有所帮助,如果你对Python其他数据结构感兴趣,请关注我的其他文章。

2024-08-18 21:42:20 1152

原创 【python学习】AC自动机 高效敏感词过滤与文本匹配:全面掌握pyahocorasick库 (NLP自然语言处理项目实战)

在处理字符串匹配的问题时,AC自动机(Aho-Corasick Automaton)是一个非常高效的算法工具。它是在1975年由Alfred V. Aho和Margaret J. Corasick提出的,用于解决多模式匹配问题。所谓多模式匹配,就是在一段文本中同时搜索多个目标字符串(模式),而不是逐一进行搜索。AC自动机的应用场景广泛,如敏感词过滤、病毒扫描、文本分析等

2024-08-17 21:22:17 1103

原创 【python学习】Asyncio库的真正力量:如何用Python编写高效并发程序

通过对`asyncio`库的全面解析,我们将结合2023年环法冠军温格高的夺冠故事,帮助你掌握如何在Python中使用异步编程处理复杂的并发任务,避免常见的错误,并提高代码的执行效率。

2024-08-17 10:58:27 1004

原创 【python学习】如何利用threading 库提升性能:深入解析与实战应用 模拟温格高的环法冠军之路

`threading` 是Python处理多线程操作的核心库,掌握它能够帮助我们更高效地进行并发编程,尤其是在处理I/O密集型任务时。我们不仅会讨论线程的基本使用方法,还将深入探讨一些高级特性和最佳实践,确保你在实际项目中能自信地使用多线程技术。

2024-08-16 21:32:20 1236

原创 【python学习】为什么你应该放弃标准 JSON 库,转向更智能的 CommentJSON?

在软件开发中,JSON 是不可或缺的数据交换格式。然而,标准的json库并不支持注释,这使得开发者在处理复杂配置文件时感到束手束脚。本文将详细介绍库,它不仅能解析标准 JSON 格式,还支持带注释的 JSON 文件。通过对比和标准json库的用法及优势,帮助你选择最适合的工具来应对实际开发中的挑战。

2024-08-16 18:27:40 849

原创 【python学习】10分钟读懂Python字典:提升你的编程效率

Python字典是一种强大的数据结构,尤其适用于需要快速访问和修改数据的场景。通过本文的介绍,你应该掌握了字典的基础操作及其核心用法,以及一些提高效率的小窍门。

2024-08-15 20:30:16 1128

原创 【python学习】深度解析LTP库:用Python轻松搞定中文NLP任务

LTP(Language Technology Platform)是一个专为中文语言处理而开发的强大工具包,它能够帮助我们高效地完成各种NLP任务,如分词、词性标注、命名实体识别、依存句法分析、语义角色标注等。这篇博客将带你深入了解如何使用LTP库处理中文文本

2024-08-15 20:20:53 985

原创 【python学习】深入了解Pydantic:详解核心功能与Pydantic v2的重大升级

Pydantic是一个Python库,用于定义数据模型并进行数据验证和解析。Pydantic的核心理念是利用Python的类型提示来定义数据模型,并通过自动验证机制确保数据的正确性。它不仅能解析JSON、字典等常见数据结构,还能进行复杂的嵌套数据结构处理,是开发者构建健壮应用的利器。Pydantic的核心功能是通过BaseModel类来定义数据模型,并自动验证数据的正确性。

2024-08-14 21:32:52 644

原创 【python学习】深入理解Python列表推导式:提升代码效率的利器

在Python编程中,列表推导式是一种强大的工具,能够让你的代码更简洁、更具可读性。这篇文章面向具有一定Python基础的开发者,旨在深入讲解列表推导式的使用方法、常见的应用场景以及一些高级用法。

2024-08-14 18:38:05 875

原创 【langchain学习】从零开始掌握 JSONLoader:轻松解析复杂 JSON 数据

JSONLoader不仅可以提取数据,还允许我们自定义元数据。这对于需要对数据进行进一步处理和分析的场景非常有用。

2024-08-13 19:00:21 576

原创 【python学习】深入解析 `jq` 库:JSON 处理的利器

jq库是 Python 对流行的命令行工具jq的封装。它允许你直接在 Python 中使用jq的查询语言来处理 JSON 数据。借助jq,你可以轻松地对 JSON 数据进行过滤、选择、转换、聚合等操作,极大地简化了代码复杂度。

2024-08-13 18:29:56 474

原创 【python学习】深入解析 Python `typing` 库:让你的代码更安全、更优雅

通过使用类型提示和静态类型检查工具,我们可以在开发早期发现潜在错误,并让代码的意图更加清晰。这不仅使得代码更容易维护和理解,还能够借助类型检查工具(如 MyPy)在开发过程中发现潜在的类型错误。在 Python 中,你可以通过类型提示明确指定函数的参数和返回值类型。这让代码更加清晰,避免了类型混淆。使得类型提示更加灵活,可以用于任何符合协议的类型,而不必强制类型继承特定类。在某些场景下,我们需要为某个基本类型创建一个新类型,以便区分不同的用途。允许我们为字典的键值对指定类型,从而提供一种类型安全的字典。

2024-08-12 22:12:16 1121

原创 【python学习】巧用notedown:Markdown与Jupyter Notebook的高效互转指南

在数据科学、教学、技术写作等领域,Markdown 文件和 Jupyter Notebook 都是非常重要的工具。notedown是一个轻量级的 Python 库,能够方便地将 Markdown 文件转换为 Jupyter Notebook,或将 Jupyter Notebook 转换为 Markdown 文件。这篇博客将介绍notedown的基本用法、常见命令行操作,以及一些高级功能和用法。

2024-08-12 08:57:27 566

原创 【langchain学习】使用 langchain 构建复杂逻辑的 FewShotPromptTemplate 处理自然语言问题

在自然语言处理中,处理复杂的推理问题需要考虑多步推理、条件判断以及上下文信息。本文将展示如何使用 LangChain 创建一个带有复杂逻辑的 `FewShotPromptTemplate`,并结合语义相似性示例选择器来选择最相关的示例以生成更加智能的响应。

2024-08-11 16:32:41 589

原创 【langchain学习】使用缓存优化langchain中的LLM调用性能:内存、SQLite与Redis的对比

内存缓存:适用于不需要持久化缓存数据的高性能应用。SQLite缓存:适用于单机环境下需要持久化缓存数据的应用。Redis缓存:适用于需要高性能、持久化以及跨进程或分布式部署的应用。通过合理地使用缓存机制,开发者可以显著提高LLM调用的效率,优化系统性能。在实际项目中,可以根据需求和环境选择合适的缓存方案,以实现最佳的性能和用户体验。

2024-08-11 10:39:53 779

原创 【langchain学习】使用Elasticsearch和LangChain进行文档相似度搜索

通过上述示例,我们展示了如何使用 Elasticsearch 和 LangChain 进行文档的相似度搜索。这个过程不仅简化了大规模文档库中的查询操作,而且通过分数的返回,让我们能够更好地判断结果的相关性。这种方法在需要快速检索和分析大规模文本数据的应用中具有广泛的潜力。

2024-08-10 10:37:34 624

原创 【langchain学习】使用LangChain创建具有上下文感知的问答系统

探讨如何使用LangChain库创建一个上下文感知的问答系统。这个系统能够根据用户的聊天历史,将当前问题转化为一个独立的问题,接着根据上下文提供准确的答案。

2024-08-09 16:33:56 347

原创 【langchain学习】BM25Retriever和FaissRetriever组合 实现EnsembleRetriever混合检索器的实践

展示如何使用 LangChain 的组合 BM25 和 FAISS 两种检索方法,从而在检索过程中结合关键词匹配和语义相似性搜索的优势。通过这种组合,我们能够在查询时获得更全面的结果。

2024-08-09 10:37:25 904

原创 【python学习】用 Python 实现智能文本匹配:揭秘 rank_bm25 和 jieba 的强大组合

介绍如何使用jieba分词库和rank_bm25库中的 BM25Okapi 算法来计算文本相似度。我们将通过一个简单的示例,展示如何实现这一过程。

2024-08-08 10:22:13 839

原创 【langchain学习】解决langgraph在pycharm中无法可视化graph;出现<IPython.core.display.Image object>的问题

【langchain学习】解决langgraph在pycharm中无法可视化graph;出现<IPython.core.display.Image object>的问题。

2024-08-07 10:35:07 219

原创 【langchain学习】使用langgraph构建简单聊天机器人

使用langgraph快速开始,构建一个聊天机器人

2024-08-06 22:34:23 473

原创 【python学习】一篇带你玩转 Python JSON 操作的终极指南:dump、dumps、load、loads 全解析

json.dump: 用于将 Python 对象转换为 JSON 字符串并写入文件。json.dumps: 用于将 Python 对象转换为 JSON 字符串。json.load: 用于从文件中读取 JSON 数据并解析为 Python 对象。json.loads: 用于将 JSON 字符串解析为 Python 对象。通过掌握这些函数,你可以轻松地在 Python 中处理 JSON 数据,无论是读写文件还是处理网络请求中的 JSON 数据,都变得非常简单和高效。

2024-08-06 16:50:09 556

原创 【langchain学习】配合Redis向量库时报错:Redis cannot be used as a vector database without RediSearch >=2.4

配合Redis向量库时报错:Redis cannot be used as a vector database without RediSearch >=2.4

2024-08-05 17:03:44 175

原创 【langchain学习】使用JsonOutputParser让大模型生成结构化JSON数据

使用Langchain处理结构化数据,以JsonOutputParser为例。

2024-08-04 23:21:01 837

原创 【langchain学习】使用Langchain生成多视角查询

使用Langchain生成多视角查询。

2024-08-03 22:12:11 1185

原创 【langchain学习】使用PandasDataFrameOutputParser对DataFrame进行数据处理

介绍如何使用Langchain结合ChatGLM对Pandas DataFrame进行数据处理。

2024-08-02 21:37:51 577

原创 【langchain学习】GraphQAChain通过抽取三元组实现与图的对话

GraphQAChain通过抽取三元组实现与图的对话。

2024-08-01 22:28:03 454

原创 【langchain学习】使用OpenAIModerationChain添加审查链来规范用户提问

使用langchian在LLM应用程序中添加审查。

2024-07-31 20:47:12 113

原创 【langchain学习】LLMRouterChain和RouterOutputParser的用法详解(附代码示例)

`langchain.chains.router.llm_router` 模块中的 `LLMRouterChain` 和 `RouterOutputParser` 用于创建一个路由链条,可以根据输入动态地选择适当的处理链条。

2024-07-30 20:09:38 376

原创 【langchain学习】LLMChain和ConversationChain的用法以及区别(附代码示例)

LLMChain和ConversationChain的介绍

2024-07-30 20:00:10 524

原创 【langchain学习】ConversationBufferMemory清除内存的方法

在使用ConversationBufferMemory进行多轮对话的时候,可能需要定期清除memory的内存以免造成输入太长的情况。

2024-07-29 22:09:28 162

原创 【LLaMA-Factory】常见报错信息及解决方法整理

LLaMA-Factory常见报错信息及解决方法整理

2024-07-28 16:26:09 2161

原创 【python学习】retry库用法大全!附示例代码

Retry 是一个用于 Python 的库,用于在函数调用失败时自动重试。它的目标是简化重试逻辑的编写,处理由于临时性问题(如网络故障、API 限制等)导致的失败。

2024-07-27 21:25:45 956

原创 【python学习】loguru日志库用法大全!附代码示例

Loguru 是一个用于 Python 的简单且强大的日志库。它的目标是使日志记录变得简单和优雅,同时提供许多有用的功能。Loguru 的 API 非常直观,使得记录日志变得简单高效。这些示例展示了它的基本用法,可以根据实际需求进行更复杂的配置和使用。

2024-07-26 21:32:31 1169

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除