- 博客(365)
- 收藏
- 关注
原创 2026最新React教程(五)React组件状态——useState钩子的使用
状态是React组件内部可动态变化的数据,是实现组件交互的核心。useState作为React最基础的钩子函数,专门用于为函数组件添加状态管理能力。本节课将从状态的核心概念出发,讲解useState的使用语法、状态更新规则,以及复杂类型状态的处理方式,掌握组件动态交互的基础逻辑。状态是组件内部可变化的数据,useState用于为函数组件添加状态,调用后返回状态变量和更新函数;状态更新是异步的,基于最新状态更新需向更新函数传递回调函数;
2026-02-10 20:40:03
264
原创 2026最新React教程(四)React组件属性——Props的使用
Props是实现React组件间数据传递的核心机制,也是组件实现动态化、复用性的关键。通过Props,父组件可向子组件传递任意类型的数据,让相同结构的组件能渲染不同内容。本文将系统讲解Props的使用规则、只读特性、默认值设置及类型校验,掌握组件数据传递的核心逻辑。Props是父组件向子组件传递数据的核心方式,可传递任意类型数据,非字符串类型需用{}包裹;函数组件可通过解构赋值简化Props使用,Props具有只读特性,遵循单向数据流原则;可通过参数默认值设置Props默认值,使用。
2026-02-10 20:07:25
373
原创 2026最新React教程(三)React组件入门——函数组件的创建与使用
组件化是React的核心设计思想,也是构建复杂UI的基础逻辑。函数组件作为React组件最基础、最常用的形式,其创建与使用是掌握React组件化开发的第一步。本文将从组件化思想的核心价值出发,逐步讲解函数组件的定义规范、导入导出规则、嵌套使用方式及基础复用逻辑,建立组件化开发的基本认知。组件化思想核心是将页面拆分为独立、可复用的组件,降低开发复杂度,提升维护效率;函数组件需遵循首字母大写、返回合法JSX的规范,可通过普通函数或箭头函数定义;
2026-02-10 19:34:49
398
原创 2026最新React教程(二)React核心基础——JSX语法规则
JSX是React构建用户界面的核心语法,它看似与HTML相似,实则是JavaScript的语法扩展。掌握JSX的使用规则,是编写React组件的基础。本文将从JSX的本质出发,逐步讲解其语法规范、表达式嵌入方式、条件渲染逻辑,以及与原生HTML的核心差异,帮助建立正确的JSX使用思维。JSX是JavaScript语法扩展,最终编译为调用,核心用于简洁描述UI结构;JSX需遵循标签闭合、驼峰属性命名、单根节点等规范,注释使用{/* */};JSX中用{}
2026-02-10 19:28:40
224
原创 2026最新React教程(一) React入门认知与开发环境搭建
React是由Meta(原Facebook)开发并维护的前端JavaScript库,核心聚焦于用户界面构建,凭借组件化、声明式的特性成为前端开发的主流技术。React是聚焦UI层的JavaScript库,核心优势为声明式编程、组件化复用、虚拟DOM,适用于单页面应用、跨平台开发等场景。学习React需掌握HTML/CSS/JS核心基础,开发环境依赖Node.js,可通过Create React App快速创建标准化项目。
2026-02-10 19:24:55
653
原创 2026最新Vue经典面试题总结(含答案)
分4个阶段:① 创建阶段:beforeCreate(实例刚建,data/methods未初始化)、created(实例建好,data/methods可用,DOM未挂载);③ 组件内守卫:beforeRouteEnter(进组件前,无this)、beforeRouteUpdate(路由参数变但组件复用)、beforeRouteLeave(离开组件前,提示未保存表单)。:① 作用:连接数据和视图,先收集依赖(数据访问时Watcher进Dep),再触发更新(数据变,Dep通知Watcher更视图);
2026-02-09 21:57:56
925
原创 Python系列进阶教程(五)Python 模块化、包管理与常用标准库进阶
本文聚焦Python工程化开发的基础环节——模块化、包管理与常用标准库进阶。随着程序规模扩大,零散的代码会变得难以维护,模块化与包管理能实现代码的拆分、复用与规范,而核心标准库则是Python内置的“工具集”,无需额外安装即可直接使用,大幅提升开发效率。本节课将从自定义模块入手,逐步推进到包管理、导入规范、标准库实战,最后通过模块化拆分实战巩固知识点,由浅入深、贴合实战,确保每个知识点可落地、易理解。模块(Module)本质是一个后缀为.py的Python文件,里面包含函数、类、变量等代码,核心作用是。
2026-02-09 21:21:33
606
原创 Python系列进阶教程(三)Python 正则表达式
本文聚焦文本处理的核心工具——正则表达式(re模块),它能快速实现文本匹配、提取、替换、分割等操作,是日志分析、数据清洗、表单校验等场景的必备技能。本节课核心掌握了正则表达式的基础语法与re模块核心用法,从元字符、量词、分组等基础,到匹配、提取、替换、分割等实战,再到综合文件读写,形成完整的学习闭环。正则表达式的核心价值是“高效处理文本”,后续的模块化开发、综合项目中,将频繁用于数据清洗、表单校验、日志分析等场景。下一节课将学习模块化与包管理,实现代码的工程化拆分,进一步提升代码的可复用性与可维护性。
2026-02-09 21:16:00
600
原创 Python系列进阶教程(三)Python 高级数据结构与内置高阶函数
上一节课完成了面向对象进阶的学习,掌握了继承、多态、封装深化及常用魔术方法,能够构建结构化、可复用的类与对象。本节课将聚焦Python高级数据结构与内置高阶函数,这是提升代码简洁度、执行效率的核心技巧,也是后续文本处理、数据筛选、工程化开发的基础。可迭代对象(Iterable):能直接用for循环遍历的对象(如列表、字典、字符串、range),本质是实现了__iter__()方法。迭代器(Iterator):可被next()函数调用、逐个返回值的对象,本质是同时实现了__iter__()和。
2026-02-09 20:46:54
724
原创 Python系列进阶教程(二)Python 面向对象进阶——继承、多态、封装与魔术方法
上一节课已经掌握了面向对象的基础——类、对象、实例属性与实例方法,实现了简单的代码封装。本节课将进入面向对象进阶学习,核心围绕继承、封装深化、魔术方法、静态/类方法及多态展开,这些知识点是构建可复用、可扩展工程化代码的关键,也是后续模块化、综合项目开发的基础。继承分为单继承、多层继承、多继承,核心是代码复用,super()函数可简化父类方法调用;方法重写让子类可适配自身需求,覆盖父类方法,多态依赖继承和重写,简化代码调用;封装深化通过私有属性/方法保护数据安全,外部需通过公共方法访问;
2026-02-09 20:40:30
937
原创 Python系列进阶教程(一)Python 面向对象
面向对象是Python的核心编程范式,也是大型项目开发的基础,掌握它能让你从“编写零散代码”过渡到“构建结构化、可复用的代码”。本节课将从面向过程与面向对象的核心差异入手,逐步讲解类与对象的基础概念、属性与方法的定义使用,最终通过实战案例巩固核心知识点。# 定义类的基本语法 class 类名 : # 类的内容(属性、方法) pass实例属性是对象的“特征”,每个实例的属性可以不同(如rect1宽5,rect2宽8)。实例方法是对象的“行为”,必须定义在类内部,第一个参数为self。
2026-02-09 20:26:36
1306
原创 Python系列基础教程(十)Python 结构化文件读写与模块基础
第9课已掌握文本文件(.txt)的基础读写,实现了数据持久化,但文本文件存在明显局限——数据无固定格式,读写后需手动拆分、处理(如拆分姓名与成绩),效率低且易出错。本节课将学习两种初学者必备的结构化文件(CSV、JSON),它们有固定数据格式,可直接与列表、字典对应,读写更高效;同时讲解模块基础,通过导入Python内置模块(csv、json、os),简化结构化文件操作,无需编写复杂逻辑。
2026-02-07 19:07:14
377
原创 Python系列基础教程(九)Python 文件读写基础
前8课已掌握变量、循环、容器、函数及异常处理,能编写具备完整逻辑的程序,但此前所有程序中的数据(如列表、字典存储的成绩、用户信息),都是临时数据——程序运行结束、关闭后,数据会全部丢失,无法长期保存。文件读写的核心价值是“数据持久化”,通过读取本地文件中的数据、将程序中的数据写入本地文件,实现数据长期存储、重复使用。
2026-02-07 19:03:03
301
原创 Python系列基础教程(八)Python 函数进阶与异常处理
第7课已掌握函数的基础定义、参数、返回值,能封装复用简单逻辑,但实际编程中,会遇到两个核心问题:一是函数调用时,可能因参数错误、数据异常导致程序直接崩溃(如除数为0、输入非数字);二是固定参数的函数无法灵活处理不确定个数的参数,也难以实现嵌套逻辑、重复调用自身的复杂需求。本节课将重点讲解异常处理(解决程序崩溃问题)与函数进阶(扩展函数灵活性),从基础用法逐步过渡到综合实战,所有代码遵循Python规范,可直接复制执行,让编写的函数更稳健、更具通用性,为后续复杂程序开发提供保障。
2026-02-07 18:54:50
336
原创 Python系列基础教程(七)Python 函数基础
前6课已掌握变量、数据类型、循环、四大容器,能编写基础逻辑代码,但实际编程中,常会出现“重复编写相同代码”的情况(如多次计算成绩平均值、多次判断素数),既繁琐又难以维护。函数的核心价值是“代码复用”,将重复逻辑封装成一个可调用的代码块,只需编写一次,后续可无限次调用,同时让代码结构更清晰、易修改。本节课从函数基础定义、调用开始,逐步过渡到参数、返回值、局部全局变量、匿名函数,结合前序知识实现实战封装,所有代码遵循Python规范,可直接复制执行,为后续复杂程序开发、模块化编程奠定基础。
2026-02-07 18:52:14
762
原创 Python系列基础教程(六)Python元组、字典、集合
上一课学习的列表,是通用型有序可变容器,适用于大多数批量数据场景,但实际编程中,会遇到“数据不可修改”“快速查询关联数据”“数据去重”等特殊需求,仅靠列表无法高效实现。本节课将学习另外三大核心容器:元组(固定不可变数据)、字典(键值对关联数据)、集合(无序唯一数据),重点讲解它们的核心特性、操作方法,以及与列表的区别、各自适用场景,逐步过渡、层层递进,结合代码示例落地应用,掌握这四大容器的选型技巧,为后续复杂数据处理奠定基础。所有代码均遵循Python规范,可直接复制执行。
2026-02-07 18:48:11
413
原创 Python系列基础教程(五)Python列表(list)
上一课循环结构解决了代码重复执行的问题,而实际编程中,常常需要批量存储、管理一组同类数据(如多个成绩、多个姓名),单个变量无法高效完成这类操作。列表作为Python最常用的有序容器,可容纳任意类型数据,支持增删改查、排序、遍历等多种操作,是批量数据处理的核心工具。本节将从列表基础定义逐步过渡到复杂操作,结合循环、输入函数实现实战功能,所有代码遵循Python规范,可直接运行验证,为后续其他容器学习奠定基础。列表使用方括号[]包裹,元素之间用逗号。
2026-02-07 18:31:33
252
原创 Python系列基础教程(四)Python while与for循环
循环结构用于重复执行一段代码,是简化重复操作、实现批量处理与持续交互的核心语法。本节从循环的基础作用出发,依次讲解while条件循环、for遍历循环,配合range函数、break、continue实现精细化控制,再扩展循环嵌套与else用法,结合输入函数完成交互程序,所有语法严格遵循Python缩进规则,代码可直接运行验证,为后续容器遍历、数据批量处理奠定基础。循环用于重复执行代码,while依赖条件判断,for侧重序列遍历while循环必须更新条件,避免无限循环,可通过Ctrl+C手动终止死循环。
2026-02-07 18:28:55
339
原创 Python系列基础教程(三)Python比较与逻辑运算符、条件判断语句
程序的核心价值之一是根据不同数据执行不同逻辑,而条件判断是实现这一功能的基础。本节将先掌握用于生成判断结果的比较、逻辑运算符,再学习if、if…else、if…elif…else等分支语句,配合缩进规则完成分支逻辑编写,同时解决输入与判断结合的实际场景,为后续循环、函数等复杂逻辑奠定基础。布尔表达式是条件判断的核心,结果为True/False;比较运算符用于数据对比,==判断相等,为赋值不可混用;逻辑运算符and/or/not可组合多条件,优先级not>and>or;
2026-02-07 18:26:18
844
原创 Python系列基础教程(二)Python基础数据类型与常用运算符
数据是程序的核心处理对象,不同数据对应不同操作规则。例如数字可进行数学计算,文本无法直接参与除法运算。本节将系统讲解Python基础数据类型、类型判断与转换方法,以及算术、赋值、字符串相关运算符,同时引入输入函数实现程序与用户的基础交互,构建完整的“输入-处理-输出”基础流程。基础数据类型包含int、float、str、bool,type()可判断数据类型强制类型转换需遵循数据规则,非数字文本无法转为数值类型算术运算符支持基础计算与整除、取余、幂运算,除法默认返回浮点数。
2026-02-07 17:49:11
441
原创 Python系列基础教程(一)Python 基础输出、注释与变量赋值
本节为Python语法体系的起始内容,核心目标是掌握程序基础输出、代码注释规范、数据存储的变量定义与赋值规则,所有后续流程控制、数据结构、函数等知识均基于本节内容延伸,需严格遵循语法书写规则,保证代码可正常执行。sep参数用于指定多个内容之间的分隔符号,需放在所有输出内容之后。# 用横线分隔多个内容print("姓名", "年龄", "城市", sep="-")# 用竖线分隔默认end=“\n”(换行),修改end可取消换行或自定义结尾内容。# 取消自动换行,结尾用空格。
2026-02-07 17:47:30
874
原创 大模型微调教程(二)LoRA 微调核心实操
上一节课咱们已经搞定了基础认知+环境搭建,这节课咱们直接进入核心实操——用LoRA轻量微调酒店评论情感分类(判断一条评论是正面还是负面)。【过程代码出现问题,请AI来调试】# 文本向量化text,# 推理(不计算梯度,加速推理)# 获取预测结果# 转换为情感标签sentiment = "正面" if prediction == 1 else "负面"
2026-02-02 16:48:21
902
原创 大模型微调教程(一)大模型微调基础认知+零基础环境搭建
欢迎来到大模型微调的入门课堂!对于初学者来说,入门的关键不是 “学得多快”,而是 “学得扎实”。这节课我们会先花时间把微调的核心概念砸实 —— 用生活化的场景帮你理解 “预训练模型”“Tokenizer”“显存” 这些关键术语;再手把手带你搭建适配新手的低门槛环境,从 Anaconda 安装到库版本验证,每一步都有明确指令和问题解决方案。跟着这节课的节奏,你会发现微调入门并没有那么难。官方简化版。
2026-01-26 19:36:31
472
原创 Vue3 系列教程(三)插值表达式与常用文本指令
第2课已掌握Vue3应用的创建、挂载及单文件组件的基础结构,本课将聚焦Vue3中最基础的页面渲染方式——插值表达式与文本指令,理解不同文本渲染方式的使用规则与适用场景,掌握基础数据到页面的渲染逻辑,为后续动态数据展示打下基础。插值表达式({{ }})是基础文本渲染方式,支持简单JS表达式,可与其他文本混合,但存在闪显问题;v-text以纯文本形式渲染内容,覆盖元素全部内容,无闪显问题;v-html可渲染HTML内容,但存在XSS风险,禁止渲染用户输入内容;
2026-01-26 19:29:03
514
原创 Vue3 系列教程(二) 创建第一个 Vue 应用
第1课已完成Vue3开发环境搭建与项目结构认知,本课将聚焦Vue3核心应用的创建流程,掌握createApp函数与mount方法的使用逻辑,理解单文件组件的基础结构,最终实现一个可独立运行的自定义Vue3应用,为后续指令、响应式数据的学习奠定基础。createApp函数用于创建Vue3应用实例,mount方法将实例挂载到指定DOM节点,二者是创建Vue3应用的核心步骤;Vue3单文件组件包含template、script、style三部分,template需有唯一根元素,scoped属性可避免样式污染。
2026-01-26 19:23:37
508
原创 Vue3 系列教程(一)Vue3初识与环境搭建
Vue3是轻量、易用的前端框架,核心优势是上手快、性能好,适合新手入门;学Vue3前需掌握HTML/CSS/JS基础,开发环境要安装Node.js(用node -v/npm -v验证);体验Vue3有两种方式:CDN(零门槛)、Vite创建项目(实际开发),核心文件是main.js(入口)和App.vue(根组件)。
2026-01-26 19:12:41
516
原创 一文了解大模型部署
大模型技术部署,本质是将经过训练、微调、轻量化优化后的模型,结合硬件环境、推理框架和工程架构,搭建可对外稳定提供推理服务的端到端系统工程,其核心是实现“模型能力”到“业务服务”的转化。它与单纯的模型推理有本质区别:推理只是加载模型完成“输入-计算-输出”的单次过程,而部署是一套完整的工程化体系,包含模型适配、推理优化、服务封装、请求调度、监控运维、容灾备份等多个环节,最终实现模型服务的规模化、标准化、稳定化输出。大模型部署的核心目标是在业务需求和资源成本低延迟。
2026-01-24 18:31:45
540
原创 零基础搞懂大模型微调:入门必备知识点
简单来说,大模型微调就是在已经训练好的预训练大模型基础上,用针对特定任务的少量数据,对模型参数做小幅度、针对性更新的过程。如果把预训练比作让模型完成了从小学到大学的“通识教育”,掌握了语言规律、基础常识和通用的理解生成能力,那微调就是给模型上“专业课”——比如想让模型做电商客服,就用电商的问答样本让模型学习;想让模型写产品文案,就用“产品信息+文案”的样本做训练。这个过程的核心是保留模型的通用能力,只让它学习特定场景的专属知识和执行逻辑,不会让模型因为专项训练丢失原本的能力。
2026-01-23 19:44:49
572
原创 大模型微调深度详解:方法、流程与问题解决
大模型微调,本质是在已完成预训练的大模型基础上,使用针对特定任务的标注数据集,通过正向训练和反向传播,对模型参数进行小幅度、针对性更新的过程。如果说预训练是让模型“读遍万卷书,通晓天下事”,掌握的是通用的语言逻辑、词汇搭配和基础常识,那么微调就是给模型做“专项特训”——比如让模型反复学习医疗问诊的对话样本,掌握疾病咨询的专业表达和逻辑;让模型学习金融研报的写作范式,能生成符合行业规范的专业文案。这个过程的核心原则是保留预训练模型的通用能力,同时让模型学习并固化特定任务的专属知识和执行逻辑。
2026-01-22 20:32:22
484
原创 大模型预训练技术全解析:从原理到工程实践
大模型预训练,本质是在海量的无标注(或弱标注)文本数据上,让基于Transformer架构的模型通过自监督学习的方式,学习语言的语义、语法、逻辑关系和通用世界知识,最终形成一个具备基础语言理解和生成能力的通用模型的过程。简单来说,预训练就是让模型“读遍万卷书”,这个过程中,模型不会被限定具体任务,而是自主从海量数据中挖掘语言的底层规律——比如理解“苹果”既可以指水果,也可以指科技品牌;掌握因果关系、逻辑推理,能根据前文内容合理预测后续文本。这个阶段训练出的模型被称为预训练模型。
2026-01-22 20:25:23
560
原创 大模型推理核心技术全解析:从原理到落地
大模型推理,本质是将训练/优化后的模型权重加载到硬件中,对用户输入的文本进行编码、计算,最终通过模型的生成逻辑输出目标结果的全过程,也是大模型发挥实际业务价值的核心环节。这一环节与模型训练有着本质区别:训练是通过海量数据反向更新模型参数,追求的是模型性能的收敛,对速度和实时性要求低;而推理是固定模型参数做正向计算,追求的是单请求处理的低延迟、单位时间处理更多请求的高吞吐,以及对硬件资源的高效利用。对于大语言模型而言,推理还有一个显著特征——自回归生成。
2026-01-22 20:19:08
665
原创 大模型量化的底层逻辑与实操要点
大模型量化,本质是通过降低模型参数和计算过程中的数值精度,实现模型压缩、减少显存占用并提升推理速度的轻量化技术。大模型在预训练和微调阶段,默认采用32位浮点精度(FP32)存储参数和进行计算,这是为了保证模型的训练稳定性和精度表现。但FP32的每个参数需要占用4个字节的存储空间,千亿参数的模型仅参数存储就需要数百GB显存,且高精度计算会让推理速度大幅降低。量化的核心思路,就是把高精度的数值格式(如FP32、FP16)转换为更低精度的格式(如INT8、INT4、FP8),用少量的精度损失换取大幅的资源节省。
2026-01-22 20:14:13
563
原创 大模型推理入门:全流程深度解析
大模型推理的核心定义,本质上是基于已训练完成的大模型参数,给定输入信息后,通过模型的计算逻辑生成符合任务要求的输出结果的过程。它和大模型训练是完全不同的两个阶段,训练的核心是通过海量数据迭代更新模型的权重参数,让模型学习到语言、知识、逻辑的规律,过程中需要频繁的反向传播和参数优化,对算力、数据的要求极高。而推理是模型训练完成后,参数固定不变,仅通过前向传播完成“输入-计算-输出”的映射,核心诉求是在保证输出结果准确率的前提下,实现低延迟、高吞吐、低资源占用。
2026-01-21 19:12:06
715
原创 大模型相关优化技术解析
大模型(LLM)正面临类似的挑战。巨大的计算和内存开销:训练需要成千上万的GPU数月时间,推理(使用)时也需要昂贵的算力。极致的延迟:生成一句话可能需要数秒甚至更久,难以满足实时交互需求。高昂的部署成本:将庞然大物塞进有限的服务器或端侧设备极为困难。因此,“大模型优化”并非可有可无的选修课,而是将其从实验室瑰宝转变为实用工具的必修课。其核心目标就是在尽可能保持模型能力(如回答质量、推理能力)的前提下,显著提升其效率、降低资源消耗。
2026-01-21 18:45:06
607
原创 关于大模型评估,看这篇就够了
随着大模型技术的快速迭代,越来越多的模型被推向市场,从通用大模型到垂直领域微调模型,不同模型的性能、适配场景差异显著。如果不能科学、全面地评估模型,就很难判断其是否符合实际应用需求,甚至可能导致项目落地失败、资源浪费等问题。今天咱们就从基础概念入手,一步步拆解大模型评估的核心逻辑、关键维度、常用方法和实践要点,帮大家把大模型评估的思路理清楚、弄明白。
2026-01-21 18:19:20
498
原创 关于MoE(混合专家模型):看这篇就对了
要理解MoE,首先要明确它解决的核心问题——传统稠密Transformer的固有瓶颈。Transformer是当前大模型的基础架构,其核心的前馈神经网络(FFN)层是模型做特征加工的关键,但传统的FFN是稠密层计算成本指数级增长:模型参数量扩大时,训练和推理的浮点运算数(FLOPs)会同步线性甚至超线性增长,千亿级参数模型的训练需要上千块GPU的集群,推理延迟也会大幅增加;参数利用率极低。
2026-01-21 10:50:59
488
原创 大模型微调常见问题解决方案汇总
大模型微调的整个流程环环相扣,环境、数据、训练、效果、部署任一环节出现问题,都会影响最终的落地效果,而解决这些问题的核心,是**“先解决基础问题,再优化效果问题”**:先把环境配置、数据处理的基础工作做扎实,这是微调成功的前提;再通过参数高效微调(LoRA/QLoRA)规避硬件资源、灾难性遗忘等问题,这是实操中的主流选择;最后针对效果问题,从数据和超参两个核心维度迭代优化,而非盲目增加训练轮数或更换模型。
2026-01-20 14:28:32
565
原创 一文搞懂大模型蒸馏(初学者必看)
大模型蒸馏作为一种高效的模型压缩与知识迁移技术,其核心价值在于“平衡性能与效率”,让大模型的强大能力能够下沉到更多资源受限的场景。从基础的响应蒸馏到进阶的特征蒸馏、提示蒸馏,技术的发展始终围绕“更高效地迁移教师知识”这一核心目标。自适应蒸馏:根据学生模型的学习状态动态调整蒸馏策略(如动态调整温度T、损失权重);多教师蒸馏:让多个不同的大模型同时指导学生模型,融合不同模型的优势;跨模态蒸馏:实现不同模态(文本、图像、语音)之间的知识迁移,让一个小模型具备多模态能力。
2026-01-19 19:40:11
687
原创 大模型量化技术解析
要理解量化,首先要明确模型的数据精度这个前提。我们常见的大模型,在训练阶段通常使用FP32(32位浮点型)甚至FP16(16位浮点型)来存储参数和计算中间结果。浮点型数据的优势在于,能够精准表示极大或极小的数值,同时保留足够的小数部分精度,这对于训练过程中梯度的微小更新至关重要。但缺点也很明显:占用空间大、计算速度慢。比如一个FP32的参数,需要4个字节存储,而如果换成INT8(8位整型),只需要1个字节,存储空间直接减少为原来的1/4。量化的本质,就是。
2026-01-19 19:38:31
803
原创 大模型微调技术入门
要理解微调,首先要区分预训练和微调两个阶段。预训练是大模型的“基础教育”阶段:开发者用海量无标注的通用数据(书籍、网页、论文等)训练模型,让它学习语言的底层规律,比如语法结构、语义关联、常识知识等。这个阶段的模型就像一个博览群书的通才,能应对各种通用场景,但缺乏某个细分领域的“专业技能”。而微调,就是大模型的“职业深造”阶段:在预训练模型的基础上,用小批量、有标注的任务专属数据继续训练,让模型学习特定任务的模式,最终适配目标场景。
2026-01-18 14:51:45
646
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅