- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 LangChain:大模型应用开发利器
随着大语言模型(LLMs)的快速发展,单纯使用原生LLM很难满足复杂场景的开发需求——比如需要结合上下文对话、处理文档、调用第三方工具等。LangChain作为一款围绕LLMs构建的开发框架,完美解决了这一痛点,它不重复造轮子(不开发LLMs),而是专注于“连接”与“简化”,让开发者能快速搭建高性能、可扩展的LLM应用。
2026-03-25 09:43:59
635
原创 AI Agent 从入门到实践:核心概念、架构
AI Agent 是当前人工智能领域的热门方向,它以大语言模型(LLM)为核心,结合记忆、任务规划与工具调用能力,成为能够自主感知环境、决策并执行动作的智能实体。本文将从 AI Agent 的定义、核心架构、类别划分出发,对比其与传统软件的本质差异,并通过 AutoGPT、CrewAI 等典型框架,结合「自动生成书信并发送邮件」的实战案例,带你全面理解 AI Agent 的工作逻辑与落地实践。
2026-03-21 07:15:00
605
原创 GPTs,Coze与Assistant API相关原理
本文介绍了GPTs、国产平台Coze及Assistant API三类AI助手搭建工具。GPTs是OpenAI推出的零代码定制化ChatGPT助手服务,可供他人使用;字节跳动Coze作为国产GPTs平台,分国内、国际版本,支持多模型切换、多平台部署,国内适配性与知识库能力优于GPTs。Assistant API是OpenAI面向开发者的工具,可将AI助手集成至自有应用,支持代码解释器、检索、函数调用三大核心工具。文章还阐述了GPTs与Assistant API的底层同源等联系,从定位、门槛等维度对比二者差异,
2026-03-20 11:00:14
492
原创 大模型突破局限:FunctionCall实战指南
FunctionCall机制及其应用实践 FunctionCall是一种让大语言模型动态调用外部函数/API的机制,解决模型实时数据获取、功能扩展等痛点。其核心流程包括:模型判断需求→匹配外部函数→执行调用→整合结果生成回复。本文通过两个实战项目展示具体应用: 股票查询系统:调用新浪财经接口实现实时股价查询,重点演示必填参数处理。定义包含股票代码校验逻辑的函数,并规范描述为tools格式供模型识别。 多语言翻译工具:基于百度翻译API开发,展示必填与可选参数组合场景。通过MD5加密处理签名,支持中英日韩等多
2026-03-19 19:15:21
680
原创 金融AI:零样本到少样本的智能进化
本文介绍了基于大语言模型的金融文本智能处理项目。项目采用Zero-Shot、Few-Shot和Instruction三种提示工程方法,针对金融领域三大任务场景:1)文本分类,使用DeepSeek API实现金融文本自动归类;2)信息抽取,通过ChatGLM-6B模型提取结构化金融数据;3)文本匹配,判断金融文本语义相似度。项目创新性地结合不同提示策略:简单任务直接指令,复杂任务提供示例,专业任务预训练微调。实验结果表明,该方法能有效提升金融文本处理的准确性和效率,为金融数据分析提供了智能化解决方案。
2026-03-16 19:24:03
587
原创 大模型基础--笔记(2)
神经网络是一种模仿生物神经系统的计算模型,由输入层、隐藏层和输出层组成。文章介绍了人工神经元的结构和工作原理,以及常见的激活函数(Sigmoid、Tanh、ReLU、Softmax等)的特点、优缺点和应用场景。其中,Sigmoid适用于二分类输出层,Tanh改进了Sigmoid的均值问题,ReLU解决了深层网络的梯度消失问题,Softmax是多分类任务的标准输出层激活函数。这些激活函数的选择直接影响神经网络的性能和训练效果。
2026-03-06 12:01:51
423
原创 大模型基础--笔记(1)
本文系统介绍了人工智能领域的核心概念与技术框架,重点解析了PyTorch深度学习框架的应用方法。首先阐述了人工智能(AI)、机器学习(ML)和深度学习(DL)的基本概念与区别,指出深度学习通过多层神经网络自动提取特征,但存在可解释性差的缺点。其次详细介绍了PyTorch框架的张量操作、自动微分机制和模型训练流程,包括张量创建、类型转换、数值运算、形状变换等基础操作,并通过线性回归案例演示了完整的模型构建与训练过程。最后对比了不同深度学习框架的特点,强调PyTorch因其动态计算图和Python优先设计在学术
2026-03-01 10:11:03
1677
原创 目标检测:入门篇
目标检测是计算机视觉的核心任务,旨在定位和识别图像中的目标对象。本文系统介绍了目标检测的关键技术:1. 数据集格式(VOC/COCO/YOLO)的特点与适用场景;2. 卷积神经网络的核心组件(卷积层、池化、BN等);3. YOLO系列模型的演进与实现原理;4. Ultralytics框架的实践应用。通过代码示例展示了YOLO数据集的加载与可视化方法,并详细解析了损失函数、评估指标等技术要点。目标检测技术已广泛应用于自动驾驶、安防监控等领域,其发展趋势将聚焦于模型轻量化和小目标检测优化。
2026-02-24 17:22:54
945
原创 cursor使用插件cline chinese配置deepseek api
摘要:本文介绍如何通过DeepSeek API与Cursor结合实现智能代码生成。首先在DeepSeek官网获取API密钥,然后在Cursor中安装ClineChinese插件(熊猫头像),完成安装后进入设置配置API信息即可。这种DeepSeek+Cursor的组合方案可有效解决token耗尽问题,实现持续稳定的代码生成功能。
2026-02-14 12:04:54
768
原创 C语言实现控制台爱心:静态渐变与3D动态粒子
本文解析了两款控制台爱心图形的实现:静态渐变爱心基于笛卡尔心形公式$(x²+y²-1)³-x²y³≤0$,通过距离计算实现粉色系渐变;3D动态爱心则采用3D心形隐函数$f(x,y,z)$,结合三角函数动画和粒子化渲染,实现波动效果。代码包含完整的数学推导和Windows控制台API封装,静态版通过距离映射颜色梯度,动态版通过帧缓冲技术实现流畅动画,支持ESC键交互退出。
2026-02-08 13:04:17
1167
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅