- 博客(41)
- 收藏
- 关注
原创 数值计算与数据相关参数剖析:保障模型训练稳定与准确
本文聚焦模型微调四大核心参数,阐述其化解训练矛盾的策略:BF16用16位存储实现精度与效率的平衡,在NVIDIA GPU上训练提速1-2倍;最大样本数需依据硬件内存动态计算,规避欠拟合与显存溢出风险;截断长度通过统计分位数或任务类型设定,协调信息保留与计算成本;验证集按数据规模划分(5%-30%),分层抽样确保评估真实。调优需以硬件、数据、验证集为基准,协同参数解决四大矛盾。
2025-05-30 00:01:05
1106
原创 学习率及相关优化参数详解:驱动模型高效训练
本文解析深度学习优化参数,涵盖学习率、训练轮数、批处理大小等。学习率控制参数更新步长,需科学设置避免震荡或停滞;训练轮数依数据与模型调整,借验证集防过拟合;批处理大小与梯度累积联动硬件,按经验策略调参;学习率调节器动态优化收敛。结合代码与实战,提供系统化调参方法。
2025-05-29 00:05:11
1090
原创 模型微调参数入门:核心概念与全局视角
本文聚焦深度学习中模型微调参数这一关键领域,系统梳理了优化相关参数(学习率、训练轮数等)、数值计算参数(最大梯度范数、计算类型等)以及数据相关参数(最大样本数、截断长度等)的分类及内涵。详细阐述了调参的基本原则,包括优先关注关键参数、依据训练状态动态调整以及结合硬件资源和数据特点合理设置等要点。同时,指出了新手常见的调参误区,如盲目设置训练轮数、忽视参数关联等问题。旨在为初学者搭建模型微调参数的基础认知框架,助力其快速入门,为后续深入学习与实践奠定坚实基础。
2025-05-28 23:36:03
957
原创 余弦退火:助力模型训练的优化算法
机制原理作用模拟退火高温阶段以高概率接受损失函数暂时变差的解,低温阶段收敛到最优解跳出局部最小值和鞍点,突破高维空间中的梯度平坦区域动态步长调整LL0×1cosπ⋅tT2LL0×21cosπ⋅Tt初期大步快速探索全局空间,后期小步精细调整,平衡探索效率与收敛精度余弦退火算法的本质是通过数学规律模拟物理过程,将“无序探索”与“有序收敛”有机结合。在深度学习领域,它不仅为模型训练提供了更高效的优化路径,也为解决复杂优化问题提供了跨学科的灵感。
2025-05-27 21:57:46
478
原创 Pycharm中No Conda enviroment selected
PyCharm中 No Conda environment selected
2025-05-12 14:49:49
362
原创 年会抽奖系统
本文介绍了一款基于前端技术的年会抽奖系统,该系统使用 HTML、CSS 和 JavaScript 开发,通过 localStorage 实现数据持久化存储,无需后端支持。文中详细阐述了其项目架构、核心功能(包括抽奖、人员管理、中奖记录等)、特色功能(如奖项管理、奖品分配、动画效果、响应式设计)、技术亮点(加密级随机数、模块化设计等)、项目优势(零门槛使用、操作简单、公平公正、数据不丢失),还展示了该系统在实际活动中的应用案例,并对关键算法(Fisher - Yates 洗牌算法、防重复抽取等)进行了介绍。
2025-01-15 16:04:51
875
原创 若依修改用户默认头像
在@/assets/images目录中添加新的头像后修改profile.jpg为新头像的名称或直接将上传的文件名改为profile.jpg。在web-ui\src\store\modules\user.js 目录下,即可找到头像存储的位置。
2024-09-26 09:30:26
1489
原创 本地计算机上的MySQL8.0服务启动后停止。某些服务在未由其他服务或程序使用时将自动停止。
本地计算机上的小ySQL8.0服务启动后停止。某些服务在未由其他服务或程序使用时将自动停止。
2024-08-30 10:07:11
1357
1
原创 SpringBoot项目更换项目名称
Scope选择All Places,如图,然后点击 Refactor。scope选择 All Places,然后点击 Refactor。出现询问是否修改测试类时,点击 Select all 按钮。项目上右键->Refactor->Rename,在包上右键:->Refactor->Rename。把名称修改为 Application,把xxxx改名为mental,把项目名称修改为 mental。将name修改为mental。修改包名为 mental,4.修改pom.xml。
2024-03-28 23:13:19
3040
原创 ElasticSearch安装出现的相关错误
显然是phantomjs-prebuilt出现了问题,继续安装phantomjs-prebuilt。初次进行install时,出现了‘grunt不是内部或外部命令’错误,此时需要去安装grunt。使用 grunt -version 查看是否安装成功。此时去重新安装还是报错。此时再进行install即可安装成功。
2024-03-21 20:34:48
292
原创 XDocReport导入依赖失败
最近在学习XDocReport导出word文档,参考了https://blog.csdn.net/luck_sheng/article/details/131120863。导入对应的依赖后,maven resolving了好久,但是并无法加载正确的依赖。在添加了下述依赖后,再刷新maven就能够正确加载依赖了。
2024-03-20 10:50:55
795
原创 JDK17替换为JDK1.8失效
由于学习SpringCloud需要用到JDK17,所以重新配了一下JDK版本。学习完毕后日常工作还是需要用到JDK8,需要修改环境变量。理论上来说直接将JAVA_HOME的值直接换成 %JAVA8_HOME% 即可。但是无论怎么刷新最后的结果都是没有改变java的版本。注:更换完系统变量后需要重新打开控制台,否则不会改变JDK版本。经过不断摸索,发现了Path中JDK17的默认配置。此时将JDK17的默认配置删除即可。
2024-03-19 21:37:27
857
1
原创 Nacos Discovery服务注册中心报错
遇到如java.lang.NoClassDefFoundError: com/alibaba/nacos/client/logging/NacosLogging的报错,”在学习尚硅谷的SpringCloud 2024版的P92_Nacos之服务提供者9001入驻Nacos中心时添加下述依赖后出现上述报错。添加nacos-client依赖后即可解决报错。显然是nacos下的client依赖出现问题。
2024-03-17 19:32:22
554
1
原创 Mybatis-plus中使用新版乐观锁插件时报错,Cannot resolve symbol ‘MybatisPlusInterceptor‘
乐观锁插件报错
2022-06-27 19:45:09
2763
2
原创 解决Maven_[WARNING] Using platform encoding (UTF-8 actually) to copy filtered resources问题
Maven的Using platform encoding (UTF-8 actually) to copy filtered resources问题
2022-01-02 12:14:52
1057
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人