自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Pandas 文档学习

学习初衷是由于接触到数据分析与量化研究,开始学习Pandas,有意交流者+q 2668381762。

2025-06-10 15:10:27 125

原创 Numpy文档学习

本文记录了学习Numpy的历程,从接触数据分析与量化研究开始,到掌握Numpy基础。重点介绍了Numpy的数组计算功能,以及结合Matplotlib进行2D和3D数据可视化的方法(包括折线图、散点图和曲面图)。文中提供了示例代码,展示了如何生成随机数组并绘制图形。作者认为Numpy的核心价值在于其强大的数组计算能力,建议初学者参考官方基础教程《NumPy: the absolute basics for beginners》。学习目的是为量化程序和神经网络模型实现打下基础。

2025-06-10 09:46:04 299 1

原创 Leetcode算法学习路程(一)

集合一般被定义为:由一个或多个确定的元素所构成的整体。首先,集合里的元素类型不一定相同。你可以将商品看作一个集合,也可以将整个商店看作一个集合,这个商店中有人或者其他物品也没有关系。其次,集合里的元素没有顺序。我们不会这样讲:我想要集合中的第三个元素,因为集合是没有顺序的。列表(又称线性列表)的定义为:是一种数据项构成的有限序列,即按照一定的线性顺序,排列而成的数据项的集合。列表的概念是在集合的特征上形成的,它具有顺序,且长度是可变的。

2025-06-06 14:43:27 395

原创 意图识别智能体

自然语言处理(NLP)中的意图识别技术通过词法、句法和语义分析理解用户输入,结合机器学习算法如决策树、神经网络等,从标注数据中学习意图特征,实现对新输入的准确匹配。该技术还考虑对话上下文,提升理解准确性。功能上,它能识别明确指令和模糊表达,支持多轮对话,并提供个性化服务。应用场景包括智能客服、智能家居控制和智能助手。技术实现涉及规则匹配、机器学习模型和深度学习方法。设计时需注意上下文依赖性、模糊性处理和实时性。案例展示了基于Agno框架的AI代理实现,包括问题完整性、任务识别和目标信息识别等功能。

2025-05-15 12:07:27 377

原创 提示词工程

提示工程是一门新兴学科,专注于开发和优化提示词(Prompt),以帮助用户更有效地利用大型语言模型(LLM)进行各种应用和研究。通过掌握提示工程,用户可以更好地理解LLM的能力和局限性。提示词的质量与提供的信息数量和完善度密切相关。常见的提示技术包括零样本提示、少样本提示、思维链提示(CoT)、自动思维链(Auto-CoT)、自我一致性、生成知识提示、链式提示(Prompt Chaining)、思维树(ToT)和检索增强生成(RAG)等。这些技术通过不同的方式引导模型生成更准确、多样化的响应,尤其在处理复杂

2025-05-12 10:21:25 811

原创 Encoder与Dncoder实践学习

本文从工作原理与数学原理的角度介绍了Encoder与Dncoder,但介绍相对较为分散,后续将阅读transformer论文,给出心得。

2025-04-12 15:20:09 458

原创 文本Embedding方法选择与实践:长文本与短文本关键词的处理

LED(Long Document Encoder)是一种基于Transformer的模型,专门设计用于处理长文档。它通过局部注意力和稀疏注意力机制,能够高效地处理长文本,适用于文档长度超过16K的文本。SBERT(Sentence-BERT)是一种基于BERT的模型,专门针对句子和短文本的嵌入进行了优化。它能够高效地生成语义丰富的短文本嵌入向量,适合用于短文本相似度计算和关键词提取。

2025-04-03 17:30:58 519

原创 向量知识库(Milvus)本地部署安装——Windows

Milvus 是一个开源的向量数据库,专为 AI 应用和向量相似度搜索而设计,旨在加速非结构化数据的检索。它由 Zilliz 开发,并已捐赠给 LF AI & Data 基金会。Milvus 专注于存储、索引和管理由深度学习模型生成的高维向量数据,特别适合用于相似性搜索(Approximate Nearest Neighbor Search,ANN),在推荐系统、语义搜索、计算机视觉和自然语言处理(NLP)等领域表现出色。

2025-04-01 17:03:11 1413

原创 自然语言处理(NLP)中spacy项目实战

在本项目中,我们选择了Spacy作为主要的自然语言处理工具。Spacy是一个开源的NLP库,旨在提供高效、准确的文本处理功能。它以其简洁的API和强大的功能而闻名,特别适合处理大规模文本数据。Spacy是一个专为生产环境设计的工业级NLP库,提供了多种语言的支持。高效性:Spacy使用了最新的深度学习技术,能够快速处理文本。准确性:提供了预训练的模型,能够准确地进行词性标注、命名实体识别等任务。易用性:API设计简洁,易于上手和使用。扩展性:支持自定义管道组件和模型训练。

2025-04-01 11:26:57 930

原创 向量数据库对比学习

本文主要介绍了向量数据库及其相关特点, 并对目前部分开源向量数据库进行对比。本文后续Milvus,将更新具体的实现过程。

2025-03-28 13:18:37 899

原创 Windows系统下的Linux子系统安装与注意点

本文主要介绍使用WSL方式实现Windows下Linux子系统安装,参考WSL官方文档。

2025-03-25 16:54:47 1114

原创 大模型Prompt工程(一)

Prompt,即提示或指令,是用户输入给AI模型的文本信息,用于指导模型生成特定的输出。它是用户与AI模型之间的桥梁,决定了模型的响应方向和质量。在自然语言处理(NLP)领域,Prompt是驱动AI模型完成特定任务的核心要素。

2025-03-25 09:32:20 432

原创 基于browser-use实现浏览器自动化

Browser-use简介与使用说明,相关官方文档内容。

2025-03-24 11:52:22 931

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除