- 博客(113)
- 收藏
- 关注
原创 LangChain框架:三大模型应用全解析
本文介绍了LangChain框架对大语言模型(LLMs)的集成应用,重点解析三类核心模型:1)LLMs基础语言模型,提供统一接口支持云平台和本地部署;2)ChatModels对话优化模型,支持多角色消息输入和流式输出;3)EmbeddingsModels文本嵌入模型,将自然语言转化为向量表示。通过代码示例展示了各类模型的具体调用方式,包括Azure云服务、本地Ollama部署及HuggingFace开源模型的应用实践,体现了LangChain作为大模型开发框架的灵活性和统一性。
2026-03-06 14:02:06
413
原创 揭秘RAG技术:如何让大模型更聪明?
RAG(检索增强生成)通过为大模型配备一个可随时查阅的外部知识库,巧妙地解决了通用大模型知识静态、领域局限、易产生幻觉及数据安全等核心痛点。其核心思想检索+生成的双阶段协作,离线阶段将私有文档分块、向量化并构建索引,在线阶段将用户问题转为向量,从知识库中召回最相关的片段,再与问题一同输入大模型生成最终答案。在这个过程中,向量化扮演了关键角色——它将文本的语义转化为计算机可计算的数字表示,通过相似度匹配实现知识的精准召回。RAG并非终点,而是一个持续进化的技术框架。
2026-03-04 16:35:33
393
原创 别再只会调 LLM 了:从 ReAct 到 AI Agent 的完整实践
ReAct 并不是某种框架或组件,而是一种 推理-行动循环模式。思考 Thought 分析当前问题,判断下一步该做什么行动 Action 调用某个工具或执行某个操作观察 Observation 获取工具返回的结果答案 Final Answer 当信息足够时,输出最终结论这种模式的核心价值在于:将语言模型的推理能力与外部工具的执行能力结合起来。ReAct 并不是一个固定的模块划分,而是一种让 LLM 在思考(Thought)—行动(Action)—观察(Observation)
2026-03-02 16:40:37
868
原创 让 AI 从瞎猜到推理高手:思维链的神奇魔法
这篇文章介绍了AI大模型中的思维链(Chain of Thought, CoT)技术,它能显著提升AI在复杂问题上的推理能力。思维链通过让AI逐步展示推理过程,将复杂问题拆解为简单步骤,从而提高准确性。文章解释了两种常用形式:零样本思维链(直接指令激活)和少样本思维链(通过示例引导),并介绍了进阶的自洽性思维链(Self-Consistency)技术,即通过多次采样不同推理路径选择最一致的答案来提升稳定性。最后提供了实际应用示例和参数设置建议,展示了思维链如何帮助AI准确计算复杂数学题。
2026-02-28 16:55:41
638
原创 Prompt 工程:AGI 时代的「新编程语言」
本文探讨了Prompt技术的本质及其工程化应用。作者指出Prompt已成为AGI时代的新型"人机接口语言",相当于编程语言,而Prompt工程则是相应的软件工程。文章强调Prompt工程的核心在于将随机性输出转化为稳定可用的系统功能,包含五个关键环节:需求定义、结构化设计、调优迭代、系统集成和持续运维。其中调优过程需考虑模型特性(如GPT偏好Markdown格式)、角色设定效果(源于训练数据模式)以及格式优化。作者认为Prompt工程将发展为通用能力,但专业优势在于理解模型原理、工程落地
2026-02-27 16:22:30
1064
原创 AI将如何冲击日式瀑布开发 ?
瀑布式开发是一种。瀑布式开发 = 一步一步往下走,不能回头,像瀑布一样,流下去就流不回来了。瀑布式开发又可以被分为6大关卡,搞需求,做设计,详细设计,写代码,测试,交付。典型流程为:要件定義 → 基本設計 → 詳細設計 → 製造 → テスト → リリース稳定 不出错 责任清楚 文档齐全流程死 好管理 好追责 不容易乱尤其在,瀑布式或瀑布为主的混合模式依然是主流。需要客观说明的是,日本互联网企业(如 楽天、LINE)在部分业务中采用更接近敏捷或DevOps模式。
2026-02-25 10:14:19
669
原创 自己构建一个Agent?Agent到底再干嘛?
根据系统提示词,然后再给大模型配上相应的工具代码,一个真实的Agent就可以被真实的搭建出来啦,下一篇文章将具体实现Agent,为大模型装上手脚。
2026-02-01 21:58:24
947
1
原创 Continue插件安全性探讨
Continue 是一款面向 VS Code、JetBrains 等主流 IDE 的开源 AI 编程辅助插件,它支持集成本地(如 Ollama、CodeLlama)或云端大模型,能为开发者提供代码补全、解释、重构、调试等全流程编程助力,兼具高度可定制化与数据本地化部署的核心优势,不过其默认配置存在遥测、云回退等潜在隐私风险,需通过手动调整配置来强化代码数据的安全性。三 Continue与Cursor和Github Copilot的比较Continue 主打开源自由与本地部署。
2026-01-22 15:13:04
726
原创 Continue插件实现本地部署一个“cursor”或“github copilot”
本文介绍了如何本地部署AI代码助手作为Cursor/GitHub Copilot的替代方案。主要内容包括:1)分析本地部署在数据隐私和定制化方面的优势;2)选择Qwen2.5-14B-Instruct模型并完成部署;3)通过VSCode的Continue插件连接本地模型,详细说明了配置过程;4)测试验证功能实现。该方案特别适合企业内网开发等需要数据安全的场景,提供代码补全、对话交互等功能,同时保障数据不泄露。
2026-01-21 14:17:33
1167
原创 输入模型的训练数据需要变成什么样(基于bert模型)
使用Hugging Face transformers 库中的的 Trainer 工具( 旨在简化和标准化(自然语言处理)模型的训练过程。它抽象了训练循环中的大量样板代码,让开发者能够以更少的代码实现强大的训练功能。通过参数 train_dataset 和 eval_dataset 传递模型的训练数据和验证数据,那模型所需要的训练数据 tokenized [" train "] 和 tokenized [" validation "] 到底被构建成了什么样被输入?
2026-01-13 10:47:59
547
原创 Hugging Face Trainer
Trainer 是 Hugging Face transformers 库中提供的一个,旨在简化和标准化 NLP(自然语言处理)模型的训练过程。它抽象了训练循环中的大量样板代码,让开发者能够以更少的代码实现强大的训练功能。
2025-11-25 16:00:23
367
原创 基于 Bert 基本模型进行 Fine-tuned
实验任务 微调 Bert 基础模型让其实现情感二分类,使用的数据集为 sst-2,其数据结构如下所示。训练数据 67349 条,验证数据 872 条,测试数据 1821 条。SST-2 是自然语言处理(NLP)领域最经典的情感分类数据集之一,每个样本是单个句子(而非完整段落),标签为 0(负面)/1(正面),该数据集用于评估模型的句子级情感分类能力,是 NLP 领域的 “基准数据集” 之一 —— 几乎所有预训练模型(如 BERT、RoBERTa)都会在 SST-2 上做微调测试,以展示其文本理解性能。
2025-11-25 11:25:43
446
原创 transformer模型中的参数如何传播
在使用transformer构建模型的过程当中,不可避免的需要弄清楚每层的参数shape,以及输入输出的参数shape,以及参数的含义。本文将详细讲解使用transformer构建模型的过程所有层的输出参数及其参数的含义。
2025-11-05 14:46:31
1000
原创 Attention Is All You Need
在自然语言处理(NLP)领域,像RNN、LSTM 和 GRU 这样的循环神经网络长期以来都是处理序列数据(比如文本、语音、时间序列等)的主力方法。它们的基本思想是:每个时刻的隐藏状态不仅依赖于当前输入,还依赖于上一个时刻的隐藏状态。这样一来,模型能够捕捉到序列中的上下文信息,实现对时间/顺序的建模。但是,这种方式有两个明显的缺点:串行计算瓶颈:RNN等模型只能按顺序处理数据,不能并行。比如输入一句话时,必须等前一个词处理完才能处理下一个词,这极大限制了训练和推理速度,特别是在长序列时非常低效。
2025-08-28 15:38:46
937
原创 A Neural Probabilistic Language Model
《神经概率语言模型》是Bengio等人在2003年提出的开创性工作,首次将神经网络应用于语言建模。该研究通过分布式词表示和神经网络联合建模,解决了传统n-gram模型的数据稀疏问题。论文提出用低维稠密向量表示词语,使模型能捕捉词间相似性,显著提升了长上下文建模能力。实验表明,神经网络模型在困惑度指标上优于传统n-gram方法,尤其在处理未见词序列时展现出更强的泛化能力。这项工作为后续词嵌入技术和深度学习在NLP中的应用奠定了基础,是自然语言处理领域的重要里程碑。
2025-08-26 16:52:17
941
原创 JavaScript基础 深入浅出
JavaScript是一种解释性脚本语言,主要用于网页动态交互功能开发。文章从JavaScript概述、嵌入HTML方式、变量与数据类型、常用事件、运算符与控制语句、DOM/BOM编程等方面进行了系统讲解。重点内容包括:JavaScript的三种HTML嵌入方式(事件句柄、脚本块、外部文件)、变量声明与数据类型(原始/引用类型)、常用事件处理机制(注册与执行)、DOM编程(节点操作)和BOM编程(窗口控制)。此外还介绍了正则表达式、表单验证、内置对象Array以及定时器setInterval()等核心功能。
2025-07-31 10:02:01
906
原创 AJAX 技术
AJAX全称是 Asynchronous JavaScript and XML ( 异步的JavaScript 和 XML ),使用该技术后,可以实现不刷新整个网页,与服务器进行异步通信并更新部分网页。
2025-07-16 09:46:15
556
原创 轻松使用Pytorch实战
定义一个拥有可学习参数的神经网络return xprint(net)myNet(网络定义好后,有以下方法可以查看网络的参数10输出了网络每一层的参数两个卷积层的参数:torch.Size([512, 4096]) torch.Size([512]) 第一个全连接层 self.fc1 = nn.Linear(6488,512) 输入是4086,输出是512。对于权重 w 参数量个数是 4086×512 个,输出是512个输出,所以有512个参数 b。
2025-07-04 16:16:09
971
原创 一文速通Pytorch基础知识
Pytorch 是基于Numpy的科学计算包,给用户提供了使用GPU的强大能力,是一个深度学习平台,其基本类型是,tensors张量可以利用GPU进行加速运算。
2025-07-04 15:45:04
659
原创 一文详解 transformer 中的 self-attention
要完全理解清楚transformer结构,就必须理解self-attention是怎么运作的。在transformer中,其最核心的改进就是引入了。
2025-06-27 14:57:48
772
原创 蒸馏技术(老师----学生模型)
无反馈,不学习蒸馏技术:通过教会特定任务。这样说可能比较抽像,具体一点来说就是,现如今的大模型参数都达到了百万亿级,甚至千万亿级,对于一些公司实际使用这样的大模型需要大量昂贵的硬件资源,同时在一些硬件资源受限的终端设备中无法运行;为了让大模型减小运行时所需要的硬件资源就提出了蒸馏技术。
2025-06-27 10:28:09
825
原创 深入剖析Transformer中的Embedding
在自然语言中,有很多的词汇,汉字,单词,将他们直接的输入到模型当中,模型是不会认识他们的,只有将这些自然语言的给上对应的编码(类似自然语言:我喜欢你,就可以使用数字1来代表我,数字2代表喜欢,数字3代表你),这样一来,对于模型的输入,就可以输入123,这样机器就能接受句子我爱你了。所以。
2025-06-24 13:32:15
792
原创 OpenAI的Prompt工程
OpenAI 的 Prompt 工程是指通过设计和构建与大语言模型进行交互的输入方式,以引导模型生成期望输出的过程。任务:本文将以引导AI根据用户指令输出符合用户要求的json格式数据。测试可以正常通信后,就可以开始构建OpenAI的Prompt工程了。
2025-06-19 13:14:10
1094
原创 Vue2中的过滤器
过滤器,例如: 对一些数据进行格式化显示。他的功能完全可以使用 methods,computed来实现。①过滤器可以进行,也可以进行局部配置:全局配置:在构建任何 Vue 实例之前使用 Vue.filter('过滤器名称’,callback)进行配置。②: 在构建 Vue 实例的配置项中使用 flters 进行局部配置。过滤器可以用在两个地方:插值语法和v-bind 指令中。
2025-06-11 11:34:51
857
原创 表单数据的收集
使用Vue来进行表单数据的收集,直接上代码其运行的显示效果如下,能够成功的收集到表单信息,通过vm.user可以访问到双向数据绑定的内容如下。
2025-06-10 13:59:14
237
原创 Class的绑定
通过 <h1 class="static" :class="styleChange">{{msg}}</h1>中的 :class="styleChange"动态的绑定styleChange的值,就可以动态切换样式了。动态样式显示如下所示,当点击变大按钮的时候,其样式就会自动的变大,当点击变小的时候,其样式也会自动的变为小的样式。Class绑定对象这种方式的适用场景是已经能够确定要使用哪几个样式,且所要用到的样式名称不会变化,可以按着要求选用对应的样式。同时静态样式也可以绑定为如下所示,同时绑定两个样式。
2025-06-04 15:09:48
380
原创 methods的实现原理
首先直观的感受methods方法的使用,同样以计数器为例,不难看出来,其methods中的方法是用来和的代码。对于上述代码来说,其addOne()方法就是来处理的相应逻辑——实现不断加1的功能。在页面上点击按钮触addOne()方法,它就会执行,让count增加。
2025-05-30 22:19:30
548
原创 SpringBoot中的Lombok库
Lombok是一个Java库,通过注解的方式简化代码编写,减少样板代码。它能够自动生成getter、setter、构造函数、toString等方法,提升开发效率。Lombok只是一个编译阶段的库,因此不会影响程序的运行。
2025-05-15 15:18:18
506
原创 SpringBoot中配置绑定到bean中
SpringBoot中我们该如何将applicaton.properties中的数据绑定到bean中呢?在之间我们是可以通过@value注解,在SpringBoot自动启动后,会自动的去相应的路径中去寻找applicaton.properties配置文件,然后将相应的值赋值上。如上的方式就可以很好的将配置文件中的信息注入到bean对象中,但是一但配置文件中的要注入bean对象的信息过多的话,那我们就需要写非常多个@value的注解,这样就会非常的麻烦。
2025-05-14 11:51:44
610
原创 SpringBoot的外部化配置
所以springboot程序查找application.properties的顺序是,外部>内部;config中的>当前路径下的。
2025-05-13 21:50:07
746
原创 Vue回调函数中的this
箭头函数中的this是从父级作用域当中继承过来的。对于当前程序来说,父级作用域是全局作用域:window。addOne1是一个普通函数,能够根据调用方式来决定this的指向,上述的调用是。所以在methods中尽量的不使用箭头函数,我们常需要在回调函数中使用到this和vm实例。this就是vm,vm可以访问count通过数据代理。其实vm(vue实例对象) 和this是一个东西,所以其实我们也可以使用。是在定义时从父级作用域继承而来的,且不会被调用方式影响。当使用箭头函数之后,计数器失效。
2025-04-25 18:00:30
448
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅