大模智趣坊-CSDN博客

原创 Pandas 文档学习

学习初衷是由于接触到数据分析与量化研究，开始学习Pandas，有意交流者+q 2668381762。

2025-06-10 15:10:27 214

本文记录了学习Numpy的历程，从接触数据分析与量化研究开始，到掌握Numpy基础。重点介绍了Numpy的数组计算功能，以及结合Matplotlib进行2D和3D数据可视化的方法（包括折线图、散点图和曲面图）。文中提供了示例代码，展示了如何生成随机数组并绘制图形。作者认为Numpy的核心价值在于其强大的数组计算能力，建议初学者参考官方基础教程《NumPy: the absolute basics for beginners》。学习目的是为量化程序和神经网络模型实现打下基础。

2025-06-10 09:46:04 388 1

原创 Leetcode算法学习路程（一）

集合一般被定义为：由一个或多个确定的元素所构成的整体。首先，集合里的元素类型不一定相同。你可以将商品看作一个集合，也可以将整个商店看作一个集合，这个商店中有人或者其他物品也没有关系。其次，集合里的元素没有顺序。我们不会这样讲：我想要集合中的第三个元素，因为集合是没有顺序的。列表（又称线性列表）的定义为：是一种数据项构成的有限序列，即按照一定的线性顺序，排列而成的数据项的集合。列表的概念是在集合的特征上形成的，它具有顺序，且长度是可变的。

2025-06-06 14:43:27 487

原创意图识别智能体

自然语言处理（NLP）中的意图识别技术通过词法、句法和语义分析理解用户输入，结合机器学习算法如决策树、神经网络等，从标注数据中学习意图特征，实现对新输入的准确匹配。该技术还考虑对话上下文，提升理解准确性。功能上，它能识别明确指令和模糊表达，支持多轮对话，并提供个性化服务。应用场景包括智能客服、智能家居控制和智能助手。技术实现涉及规则匹配、机器学习模型和深度学习方法。设计时需注意上下文依赖性、模糊性处理和实时性。案例展示了基于Agno框架的AI代理实现，包括问题完整性、任务识别和目标信息识别等功能。

2025-05-15 12:07:27 1050

原创提示词工程

提示工程是一门新兴学科，专注于开发和优化提示词（Prompt），以帮助用户更有效地利用大型语言模型（LLM）进行各种应用和研究。通过掌握提示工程，用户可以更好地理解LLM的能力和局限性。提示词的质量与提供的信息数量和完善度密切相关。常见的提示技术包括零样本提示、少样本提示、思维链提示（CoT）、自动思维链（Auto-CoT）、自我一致性、生成知识提示、链式提示（Prompt Chaining）、思维树（ToT）和检索增强生成（RAG）等。这些技术通过不同的方式引导模型生成更准确、多样化的响应，尤其在处理复杂

2025-05-12 10:21:25 932

原创 Encoder与Dncoder实践学习

本文从工作原理与数学原理的角度介绍了Encoder与Dncoder，但介绍相对较为分散，后续将阅读transformer论文，给出心得。

2025-04-12 15:20:09 596

原创文本Embedding方法选择与实践：长文本与短文本关键词的处理

LED（Long Document Encoder）是一种基于Transformer的模型，专门设计用于处理长文档。它通过局部注意力和稀疏注意力机制，能够高效地处理长文本，适用于文档长度超过16K的文本。SBERT（Sentence-BERT）是一种基于BERT的模型，专门针对句子和短文本的嵌入进行了优化。它能够高效地生成语义丰富的短文本嵌入向量，适合用于短文本相似度计算和关键词提取。

2025-04-03 17:30:58 859

原创向量知识库（Milvus）本地部署安装——Windows

Milvus 是一个开源的向量数据库，专为 AI 应用和向量相似度搜索而设计，旨在加速非结构化数据的检索。它由 Zilliz 开发，并已捐赠给 LF AI & Data 基金会。Milvus 专注于存储、索引和管理由深度学习模型生成的高维向量数据，特别适合用于相似性搜索（Approximate Nearest Neighbor Search，ANN），在推荐系统、语义搜索、计算机视觉和自然语言处理（NLP）等领域表现出色。

2025-04-01 17:03:11 3441

原创自然语言处理（NLP）中spacy项目实战

在本项目中，我们选择了Spacy作为主要的自然语言处理工具。Spacy是一个开源的NLP库，旨在提供高效、准确的文本处理功能。它以其简洁的API和强大的功能而闻名，特别适合处理大规模文本数据。Spacy是一个专为生产环境设计的工业级NLP库，提供了多种语言的支持。高效性：Spacy使用了最新的深度学习技术，能够快速处理文本。准确性：提供了预训练的模型，能够准确地进行词性标注、命名实体识别等任务。易用性：API设计简洁，易于上手和使用。扩展性：支持自定义管道组件和模型训练。

2025-04-01 11:26:57 1076

原创向量数据库对比学习

本文主要介绍了向量数据库及其相关特点，并对目前部分开源向量数据库进行对比。本文后续Milvus，将更新具体的实现过程。

2025-03-28 13:18:37 1256

原创 Windows系统下的Linux子系统安装与注意点

本文主要介绍使用WSL方式实现Windows下Linux子系统安装，参考WSL官方文档。

2025-03-25 16:54:47 2381

原创大模型Prompt工程（一）

Prompt，即提示或指令，是用户输入给AI模型的文本信息，用于指导模型生成特定的输出。它是用户与AI模型之间的桥梁，决定了模型的响应方向和质量。在自然语言处理（NLP）领域，Prompt是驱动AI模型完成特定任务的核心要素。

2025-03-25 09:32:20 644

原创基于browser-use实现浏览器自动化

Browser-use简介与使用说明，相关官方文档内容。

2025-03-24 11:52:22 2551

2401_89904030的博客