自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(151)
  • 收藏
  • 关注

原创 LLaMA-Factory微调实操记录

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调。

2025-03-29 14:38:41 1339

原创 大模型微调环境配置

这篇文档主要用于环境、软件的安装,具体的训练方式仅做简单介绍。

2025-03-28 15:38:29 874

原创 【大模型原理与技术】2.0 模型架构概览

区别之处:OpenAI认为模型规模比参数更为重要。相同之处:肯定了模型规模和参数量决定模型的优劣。

2025-03-04 10:05:47 126

原创 【大模型原理与技术】1.2基于学习的语言模型

【代码】【大模型原理与技术】1.2基于学习的语言模型。

2025-03-02 17:42:25 361

原创 【大模型原理与技术】1.0序言

语言模型旨在预测一个词元或者词元序列出现的概率。现在语言模型通常是基于规则、统计或者学习来构建。目前流行的语言模型基本上都是基于学习的语言模型,因为其更加智能,是真正意义上的大模型。

2025-03-02 17:34:25 226

原创 大模型基础概念

当和大模型对话,解决一些学习问题、通用的一些工作的时候,还事可以的。但是当把开源模型运行在本地,想和工作中专业的知识进行挂钩时,落地是比较困难的。指令微调(SFT):在这里需要找到一些高质量的打标签的数据集对上面生成的预训练模型进行质量微调。模型蒸馏:一种通过知识迁移优化深度学习模型的技术,其核心目标是将复杂的大模型(教师模型)的知识传递给轻量化的小模型(学生模型):大模型根据学过的知识续写输出内容,但是当提出的问题,大模型没有学习过之后,就会瞎说,输出概率较大的内容。RLHF:基于人类反馈的强化学习。

2025-03-01 22:20:03 306

原创 【设计模式】软件开发原则

在软件开发中,为了提高软件开发的可维护性和可复用性,增加软件的可扩展性和灵活性,程序员要尽可能的遵循一下6条原则来开发程序,从而提高软件开发效率、节约软件开发成本和维护成本。

2023-04-09 10:40:54 965

原创 【设计模式】设计模式概述以及UML图

软件设计模式(Software Design Pattern),又称设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。它描述了在软件设计过程中的一些不断重复发生的问题,以及该问题的解决方案。也就是说,它是解决特定问题的一系列套路,是前辈们的代码设计经验的总结,具有一定的普遍性,可以反复使用。

2023-04-08 17:56:15 806

原创 【设计模式】常用的几种设计模式——单例模式

单例模式(Singleton Pattern)是Java中最简单的设计模式,该模式的基本思想就是:某个类负责创建自己的对象,同时确保该类的实例对象只有一个,该类提供唯一一种访问其对象的方式,可以直接访问,不需要实例化其对象

2023-04-08 12:10:58 591

原创 【Java开发面试】AHXX面试总结

面试复盘,比较精华

2023-03-07 20:21:26 533

原创 【浅学Java】MySQL索引七连炮

mysql你真的了解?

2023-03-07 16:00:11 861

原创 【浅学Java】InnoDB存储引擎下MVCC(多版本并发控制 )

MVCC太重要了

2023-03-06 09:48:10 855

原创 【浅学Nginx】Nginx安装和基础使用

Nginx入门,靠它就够了。

2023-02-13 16:58:22 613

原创 【MySQL数据库】主从复制原理和应用

主从复制都不会,你low不low啊?哈哈

2023-02-12 14:18:02 560

原创 【浅学Redis】Spring Cache的基础使用

用Spring Cache 操作redis来缓存数据,真的方便太多了

2023-02-11 00:09:52 532

原创 【浅学Redis】缓存 以及 缓存穿透、缓存击穿、缓存雪崩

缓存穿透、缓存击穿、缓存雪崩,你知道多少?

2023-02-08 21:25:27 1379 4

原创 【软件测试】关于BUG的那些点点滴滴

三言两句看透Bug

2023-01-10 20:45:10 499

原创 【浅学Java】Linux系统中的硬连接和软连接

Linux最强总结,内含机密,请肾重

2022-12-16 21:48:30 1225

原创 【浅学Java】索引的分类、创建、删除以及新特性

学索引,看这个

2022-12-16 15:25:34 1849

原创 【浅学Java】EditStarters插件的安装使用

学会使用,事半功倍

2022-12-11 20:18:46 296

原创 【浅学Java】SpringMVC程序开发

万字死磕SpringMVC,呕心沥血之作

2022-12-11 19:13:27 1364

原创 【浅学Java】SpringBoot热部署

学会热部署,让你的SpringBoot开发事半功倍

2022-12-10 22:58:03 377

原创 【浅学Java】SpringBoot 日志文件

来看看SpringBoot日志里面的学问

2022-12-08 18:22:51 948

原创 【浅学Java】SpringBoot 配置文件

SpringBoot的配置文件你知道多少?

2022-12-05 22:46:30 949 1

原创 【浅学Java】SpringBoot创建和使用

一篇文章带你进入SpringBooot的花花世界

2022-12-04 16:49:40 722

原创 世界杯,你怎么看?

2022-11-20 23:26:03 129

原创 【浅学Java】Bean的作用域和生命周期

Bean的作用域和生命周期

2022-11-19 23:10:55 583

原创 【浅学Java】Spring对象的存储和读取

Spring对象的存储和读取

2022-11-13 19:51:13 607

原创 【浅学Java】Spring的创建和使用

Spring项目的创建和使用

2022-11-07 00:12:26 662

原创 【浅学Java】Spring核心与设计思想(IoC)

初识Spring设计思想

2022-11-06 23:19:51 280

原创 【浅学Java】JVM面试必备

JVM面试必备

2022-11-02 12:27:39 759

原创 【浅学Java】在云服务器上的Linux系统上部署项目

部署web项目,可以进来看看

2022-10-25 23:41:01 1084

原创 【浅学Java】Linux常用命令

来简单学学Linux的指令

2022-10-25 20:06:53 2662

原创 【浅学Java】JDBC编程流程

JDBC编程得看看这篇文章

2022-10-19 10:15:21 313

原创 【浅学Java】Seervlet小项目——MessageWall

学Servlet,得看看这个

2022-10-18 16:29:34 951

原创 【浅学Java】Servlet详解

学Servlet看这篇少走十年弯路

2022-10-16 08:33:40 2299

原创 【浅学Java】从浏览器中输入一个URL之后,会发生什么?

必看

2022-08-17 22:25:51 492

原创 【浅学Java】详解网络层IP协议

深入浅出IP协议

2022-08-17 21:57:08 598

原创 【浅学Java】三次握手 / 四次挥手

三次握手/四次挥手

2022-08-17 14:44:34 703 1

原创 【浅学Java】深入理解TCP的10种机制

学TCP,看它就够了!

2022-08-15 22:04:07 1024

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除