- 博客(396)
- 收藏
- 关注
原创 【自然语言处理与大模型】Harness Engineering是什么?和提示词工程、上下文工程有什么关系?
AI Agent = 大模型 + Harness Engineering(凡是超出大模型范畴的部分,都可归入Harness Engineering的领域)
2026-04-16 04:24:45
476
原创 【自然语言处理与大模型】什么是大模型幻觉?
这篇文章探讨一下 AI “一本正经胡说八道” 的根源。首先我们得知道什么是大模型幻觉。然后尝试简单回答为什么会有幻觉,最后结合OpenAI发表的《语言模型为何产生幻觉》论文来揭示幻觉的本质。
2026-02-07 00:32:42
843
原创 【自然语言处理与大模型】LangGraphV1.0入门指南:核心组件Nodes
本文介绍了LangGraph框架的两个核心概念:State(状态)和Nodes(节点)。
2026-01-08 23:59:44
324
原创 【自然语言处理与大模型】提示词编写指南
本文分享了构建优秀提示词(Prompt)的心得与技巧。首先总结了提示词的通用原则:明确性、上下文、结构化和渐进式优化。针对文本生成,提出五要素公式。对于图像/视频生成,强调具象化描述的五要素。
2026-01-03 09:21:48
1173
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Structured Output
LangChain所提供的两种结构化输出的核心策略,以及如何直接让大模型能具备结构化输出能力,和如何让Agent具备结构化输出能力。
2025-12-28 20:01:39
882
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Streaming
本文介绍了LangChain支持的4种流式输出方式,可实时逐步返回LLM生成结果。支持的流式模式包括:AgentProgress模式(监控执行流程)、LLMTokens模式(实时显示文本)、CustomUpdates模式(自定义数据)和混合模式。通过将invoke改为stream/astream并指定stream_mode参数即可激活流式输出。
2025-12-27 23:59:20
574
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Short-term Memory
短期记忆 = Agent 状态(State) + 检查点持久化(Checkpointer) + 线程标识(thread_id)
2025-12-27 23:08:37
686
原创 【自然语言处理与大模型】LangChainV1.0入门指南:AgentState介绍
AgentState是LangChain中用来表示智能体在执行过程中描述当前状态的核心数据结构。它是整个工作流的“上下文容器”或“共享内存”,在各个节点之间传递,并随着流程推进不断被读取、修改和持久化。所以我一般叫他“运行时上下文状态对象”
2025-12-24 23:46:30
680
原创 【学习心得】Python的TypedDict(简介)
如果只需要静态类型提示,TypedDict更轻量;如果需要运行时数据验证,建议使用Pydantic。
2025-12-24 23:09:15
468
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Messages
LangChain中的Messages是模型交互的基本单元,包含角色(role)、内容(content)和元数据(metadata)。支持多种提示词类型:文本提示、消息对象提示和OpenAI格式提示。消息对象包括HumanMessage(用户输入)、AIMessage(模型响应)、SystemMessage(系统指令)和ToolMessage(工具调用),支持多模态内容(文本/图像等)。通过标准化消息类型确保跨模型一致性,同时保留直接使用字符串或元组的兼容性。
2025-12-22 22:39:02
403
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Tools
本文介绍了LangChainV1.0中三种创建工具的方法及其在大模型和智能体中的使用方式。
2025-12-22 22:25:34
854
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Agents
本文介绍了如何使用LangChain快速搭建基于ReAct范式的智能体。主要内容包括:1)通过create_agent函数创建智能体,只需指定语言模型和系统提示词;2)演示了智能体的基本使用方法,通过inputs字典传递用户消息并获取响应。文章还指出智能体可扩展工具功能,当前示例为基本版本,仅能基于模型知识回答问题。
2025-12-20 23:57:06
489
原创 【自然语言处理与大模型】LangChainV1.0入门指南:核心组件Models
本文介绍了LangChain的核心组件Models,并给出了接入Chat模型和Embedding模型的方法。
2025-12-20 23:15:13
1357
原创 【学习心得】基于FunASR推理的SenseVoiceSmall模型来实现语音识别
SenseVoiceSmall是一款工业级多语言音频理解模型,支持语音识别、情感分析等功能,覆盖中文、英语等多种语言,可通过魔搭社区下载。FunASR是阿里巴巴开源的语音识别工具包,提供多种语音处理功能。使用示例包括文件转录和实时麦克风输入识别,支持GPU加速和自动语言检测。安装需配置相关依赖库如sounddevice和PortAudio。模型支持文本后处理和分段合并优化,适合研究和工业应用。
2025-12-17 23:59:04
1200
原创 【学习心得】Python好库推荐——pyttsx3
pyttsx3是一个跨平台的Python文本转语音库,支持Windows、macOS和Linux系统。通过pip install pyttsx3安装后,即可在本地实现TTS功能,无需联网。
2025-12-17 12:45:17
567
原创 【学习心得】基于VOSK的唤醒词检测
本文详细介绍了VOSK的安装方法、核心功能和使用教程,包括音频采集、模型加载和唤醒词检测的实现步骤,并提供了Python代码示例。
2025-12-16 19:49:21
1207
原创 【学习心得】Python好库推荐——Pylint
Pylint 是一个用于 Python 代码静态分析的强大工具,主要用于代码质量检查和风格规范。本文介绍了如何安装并快速使用。
2025-12-07 15:11:24
1152
原创 【自然语言处理与大模型】多模态RAG的核心概念
多模态 RAG 是将检索增强生成技术扩展至多模态数据场景的系统架构。主要涵盖以下两个关键维度:富媒体文档问答和多模态输入问答
2025-12-07 12:33:36
1058
原创 【自然语言处理与大模型】三种实现多模态技术的路线
当前多模态领域,尤其是在信息检索和处理场景下,最具代表性的三条主流技术路线。它们代表了三种不同的思想:空间对齐、路径并行和模态转换。
2025-12-07 04:10:16
1527
原创 【机器学习300问】137、L1和L2正则的区别是什么?用了不同的正则项对权重w的影响是什么?
两者的主要区别体现在惩罚的形式、对权重的影响以及产生的模型特性上。
2025-11-26 15:47:43
387
原创 【学习心得】让Windows 11 右键默认“显示更多”
Windows11简化了默认右键菜单,隐藏许多功能。可通过运行两条命令恢复完整菜单:1)添加注册表项启用完整菜单;2)重启资源管理器使更改生效。要恢复默认简化菜单,只需删除注册表项并重启资源管理器。
2025-11-17 18:04:16
223
原创 【自然语言处理与大模型】RAG发展过程中的三个范式
初级 RAG(Naive RAG)、高级 RAG(Advanced RAG)、模块化 RAG(Modular RAG)
2025-09-26 11:13:55
1168
原创 【自然语言处理与大模型】RAFT(Retrieval Augmented Fine Tuning)方法
RAFT 的本质是用检索增强来生成高质量训练数据,再通过微调把“外挂知识”变成“内功修为”。
2025-09-25 19:49:43
1406
原创 【自然语言处理与大模型】开关推理模型的思考功能
开关推理模型的思考功能的两种方法:1、/no_think 2、enable_thinking
2025-09-10 03:32:57
1429
1
“阴阳怪气”语气风格DPO数据集
2025-05-18
手语识别-深度学习-自建ASL数据集-模型训练(分卷压缩第一卷)
2024-04-01
手语识别-深度学习-自建ASL数据集-模型训练(分卷压缩第二卷)
2024-04-01
手语识别-深度学习-自建ASL数据集-模型训练(分卷压缩第三卷/最后一卷)
2024-04-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅