燕双嘤-CSDN博客

原创 Fine-tuning：微调技术，训练方式，LLaMA-Factory，ms-swift

本文系统介绍了大语言模型微调技术及其训练方式。主要内容包括：1. 微调技术对比：从Full-tuning（全参数微调）、Freeze-tuning（冻结微调）到LoRA（低秩适配）和QLoRA（量化低秩适配），分析了各类方法的参数规模、显存需求、性能表现及适用场景。2. 训练方式详解：涵盖预训练、监督微调、奖励建模以及PPO、DPO等强化学习优化方法，比较了不同训练阶段的标签需求、人类偏好使用和算法特点。3. LLaMA-Factory实践指南：提供从环境配置、量化选择到数据集准备和训练参数设置的完整流程，

2025-05-27 15:03:32 959

原创 TTS：VITS-fast-fine-tuning 快速微调 VITS

VITS-fast-fine-tuning是基于VITS开发的一站式多角色模型微调工具，允许用户在不到1小时内完成模型微调，实现指定音色的语音合成和声音克隆。本地部署需要安装Python 3.8、CMake、C/C++编译器和ffmpeg，并下载预训练模型和辅助数据。训练过程中可能遇到多种报错，如尺寸不匹配、模块缺失等，需根据具体情况进行调整和解决。

2025-05-22 09:59:41 526

原创 TTS：F5-TTS，MegaTTS3

F5-TTS是一款在英文生成领域表现卓越的文本转语音（TTS）工具，其发音标准程度在评测中名列前茅。该工具支持多角色生成模式，能够一次性为多个角色和情绪生成对话式语音，功能独特。F5-TTS的最低配置要求低，无需显卡，仅需CPU即可推理生成，且生成速度在所有TTS工具中耗时最低。项目启动方式包括傻瓜式启动和部署式启动，用户可以通过简单的命令行操作快速启动服务。F5-TTS支持流式匹配，能够模仿流利、忠实的语音，适用于童话故事机等场景。此外，E2TTS作为其功能之一，提供了简单且非自回归的零样本TTS功能。

2025-05-17 17:00:40 392

原创 DeepSearch：WebThinker开启AI搜索&研究新纪元！

WebThinker是一个创新的深度研究智能体，旨在通过自主搜索网络、导航网页并撰写研究报告，显著提升知识密集型领域的研究效率。该项目利用检索增强生成（RAG）技术，但突破了传统RAG的局限，实现了端到端的任务执行，无需遵循预设的工作流程。WebThinker的核心优势在于其能够在单次生成中自主调用工具，进行深度思考和连贯性操作，从而大幅降低信息收集的时间和成本。

2025-05-16 20:55:26 680

原创 DeepSearch：字节新一代 DeerFlow 框架

DeerFlow是一个基于LangChain和LangGraph的开源Multi-Agent框架，旨在提升多智能体系统的执行效率和灵活性。其核心特性包括独家设计的ResearchTeam机制，支持多轮对话、决策和任务执行，显著减少Tokens消耗和API调用次数。DeerFlow采用MetaPrompt模式，由大模型自动生成高质量Prompt，降低Prompt工程门槛。此外，用户可通过自然语言实时修改和优化AI生成的内容。DeerFlow还支持生成播客和PPT。

2025-05-15 18:00:28 976

原创 Qwen：Qwen3，R1 在 Text2SQL 效果评估

Qwen3235B-A22B是综合性能最强的模型，尤其在复杂推理和代码生成任务中表现突出，而Qwen3-32B和30B-A3B则是经济高效的替代方案。其他模型在特定任务中表现良好，但整体性能相对较弱。

2025-05-12 19:48:38 866

原创 TTS：CosyVoice2 高质量语音克隆

CosyVoice2 只需3~10秒的原始音频，即可生成克隆音色，实现不同语言之间的语音合成，中文、英文、日语、韩语、中国方言（粤语、四川话、上海话、天津话、武汉话、长沙话、郑州话等），还支持生成具有多种情感表达的语音，包括快乐、兴奋、悲伤、愤怒等，还能通过指令控制说话的语气、情绪等

2025-04-28 10:46:21 847

原创 TTS：VITS 模型本地训练操作指南

VITS（Variational Inference Text-to-Speech）是由韩国NAVER的研究团队提出的一种端到端的文本到语音（TTS）生成模型。VITS 融合了变分自编码器（VAE）、GAN（生成对抗网络）和非自回归建模的思想，能够在保持高语音质量的同时，实现快速的语音合成。

2025-04-24 14:26:53 937

翻译 STRUCTBERT：将语言结构融入预训练以提升深度语言理解

受到Elman线性化探索工作的启发，我们在BERT的基础上提出了一种新模型StructBERT，通过在预训练过程中融入语言结构来提升表现。具体而言，我们为StructBERT设计了两个辅助任务，以充分利用单词和句子的顺序信息，从而在词级和句子级别上利用语言结构。这使得新模型能够适应下游任务所需的不同层次的语言理解能力。

2025-03-27 10:31:35 1238 1

原创 AIGC：Wan 2.1，CogView 4，BLIP3o

随着AIGC技术的不断突破，新一代模型纷纷登场，展现出更强的图文生成与理解能力。本文聚焦三款具有代表性的模型：Wan 2.1、CogView 4 和 Index-AniSora。我们将简要介绍它们的架构演进、核心特性以及在多模态生成、图像质量、风格控制等方面的表现差异，并结合实际案例评估其在AIGC应用场景中的实用价值。通过横向对比，帮助读者更好地理解当前AIGC前沿动态，把握未来创作与内容生产的新趋势。

2025-03-18 09:12:34 251

原创 DeepSeek-R1：通过强化学习激发LLMs的推理能力

我们介绍我们的第一代推理模型：DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习（RL）训练的模型，在此过程中未采用监督微调（SFT）作为初步步骤，它展现出了卓越的推理能力。通过强化学习，DeepSeek-R1-Zero 自然涌现出许多强大且有趣的推理行为。然而，它也面临一些挑战，例如可读性较差和语言混杂等问题。为了解决这些问题并进一步提升推理性能，我们引入了 DeepSeek-R1，该模型在强化学习之前结合了多阶段训练和冷启动数据。

2025-02-08 11:10:42 1061

原创 Require：CDS、CRaC & GraalVM 加速 SpringBoot 启动速度

CDS 通过在 JVM 启动时预加载常用的类数据并将它们共享在多个 JVM 实例之间来优化性能。这些类数据包括类的元数据、方法、常量池等。它是 OpenJDK（JDK 5 开始）主线中成熟且可用于生产的技术，与 GraalVM 和 Project CRaC 相比，它更易于使用，因为它具有较少的限制和副作用。

2025-01-23 11:06:59 719

原创 Require：利用MySQL binlog实现闪回操作

MySQL binlog以event的形式，记录了MySQL server从启用binlog以来所有的变更信息，能够帮助重现这之间的所有变化。MySQL引入binlog主要有两个目的：一是为了主从复制；二是某些备份还原操作后需要重新应用binlog。

2025-01-13 19:13:40 906

原创 JVM：ZGC详解（染色指针，内存管理，算法流程，分代ZGC）

ZGC 的核心是一个并发垃圾收集器，所有繁重的工作都在Java 线程继续执行的同时完成。这极大地降低了垃圾收集对应用程序响应时间的影响。ZGC为了支持太字节（TB）级内存，设计了基于页面（page）的分页管理（类似于G1的分区Region）；ZGC为了能够快速对对象进行并发标记和并发移动，对内存空间重新进行了划分，这就是ZGC中新引入的指针染色；仅支持 Linux 64 位系统，不支持 32 位平台。因此也不支持压缩指针。同时ZGC为了能更加高效地管理内存，设计了物理内存和虚拟内存两级内存管理。

2025-01-13 10:00:50 2341

原创 Bug：@ConditionalOnProperty居然不影响@Import？

结论：@ConditionalOnProperty 肯定影响 @Import！但是为啥实际项目中出现了@ConditionalOnProperty的类不加载，@Import类加载的情况？

2025-01-10 14:30:17 225

原创 Require：Helm/K3S 离线部署 Sourcegrapha

当使用 INSTALL_K3S_SKIP_DOWNLOAD 环境变量运行 K3s 脚本时，K3s 将使用本地的脚本和二进制。helm在解压后的目录中找到二进制文件，然后将其移至所需的目标位置，这样任何目录都可以使用 helm。要在单个服务器上安装 K3s，只需在 server 节点上执行以下操作。导航代码、查找引用、查看代码所有者、跟踪历史记录等。一次对许多存储库进行大规模更改并跟踪大规模迁移。搜索所有分支和所有代码主机的所有存储库。

2024-12-24 20:26:25 676

原创 Require：业界优秀的zip压缩组件

Require：业界优秀的zip压缩组件

2024-12-10 11:36:44 740

原创 JVM：堆内外存泄露排查

为了优化Java的性能，JVM在解释器之外引入了即时（Just In Time）编译器：当程序运行时，解释器首先发挥作用，代码可以直接执行。随着时间推移，即时编译器逐渐发挥作用，把越来越多的代码编译优化成本地代码，来获取更高的执行效率。解释器这时可以作为编译运行的降级手段，在一些不可靠的编译优化出现问题时，再切换回解释执行，保证程序可以正常运行。即时编译器极大地提高了Java程序的运行速度，而且跟静态编译相比，即时编译器可以选择性地编译热点代码，省去了很多编译时间，也节省很多的空间。

2024-11-28 16:26:18 2872 1

原创 Bug：引入Feign后触发了2次、4次ContextRefreshedEvent

Bug：引入Feign后发现监控onApplication中ContextRefreshedEvent事件触发了2次或者4次。

2024-11-21 19:38:45 1256

原创操作系统：线程（基本概念，内核线程，用户线程，通讯方式）

【内核级线程（内核管理）】指的是在内核支持下运行的，即无论是用户进程中的线程，还是系统进程中的线程，对应的 TCB 自然是放在操作系统里的，它们的创建、撤销和切换等也是依靠内核，在内核空间实现的。内核线程的数量=CPU的核心数。【用户级线程】仅存在于用户空间中。对于这种线程的创建、撤销、线程之间的同步与通信等功能，都无须利用系统调用来实现。对于用户级线程的切换，通常发生在一个应用进程的诸多线程之间，这时，也同样无须内核的支持。

2024-11-19 10:27:43 1073

原创 Spring：Bean（创建方式，抽象继承，工厂Bean，生命周期）

Spring可以管理singleton作用域的Bean的生命周期，Spring可以精确地知道该Bean何时被创建、何时被初始化完成、容器何时准备销毁该Bean实例。

2024-11-05 09:17:35 804

原创 Spring：Bean（基本定义，作用域，各类注入，自动装配，注解）

对于开发者来说，开发者使用Spring框架主要是做两件事：（1）开发Bean。（2）配置Bean。对于Spring框架来说，它要做的就是根据配置文件来创建Bean实例，并调用Bean实例的方法完成“依赖注入”——这就是IoC的本质。其实Spring框架的本质就是，通过XML配置来驱动Java代码，这样就可以把原本由Java代码管理的耦合关系，提取到XML配置文件中管理，这就实现了系统中的各组件的解耦，有利于后期的升级和维护。

2024-11-05 09:01:17 709

原创 Java：类集（HashMap，Map子类，ConcurrentSkipListMap）

2w字吐血整理Java：类集（HashMap，Map子类，ConcurrentSkipListMap，ConcurrentHashMap，LinkedList，Hashtable，SortedMap，TreeMap，IdentityHashMap）

2024-10-30 15:54:19 663

原创 Java：线程池（底层原理，延迟&周期，ForkJoinPool，CompletableFuture）

2w字吐血整理，Java：多线程（线程池，工作流程，拒绝策略，参数详情，队列大小设置，任务执行原理，任务提交原理，优雅停止，延迟执行，周期执行）。包括：基础知识，底层原理，代码复现，面试难点，刁钻问题解答。

2024-10-29 09:31:00 841

原创 Bug：通过反射修改@Autowired注入Bean的字段，明确存在，报错 NoSuchFieldException

Bug：通过反射修改@Autowired注入Bean的字段，明确存在，报错 NoSuchFieldException

2024-10-17 16:42:17 420

原创 Require：业界优秀的HTTP管理方案。

Require：业界优秀的HTTP管理方案。

2024-10-16 20:01:11 1118

原创 JDK并发：同步工具类（Stemaphore，CountDownLatch，CyclicBarrier，Exchanger，Phaser）

在现代Java开发中，处理并发问题至关重要，而同步工具类是实现高效多线程程序的关键。本博客将深入探讨Java中的多种同步工具，包括信号量、等待完成、阶段同步、Exchanger和Phaser。我们将逐一解析这些工具的使用场景及其背后的原理，帮助你更好地理解它们在并发控制中的角色。无论你是Java新手还是经验丰富的开发者，本文都将为你提供实用的知识和技巧，助你在并发编程的世界中游刃有余。

2024-10-09 09:07:42 621

原创 Spring：基本概念，管理Bean，核心问题

Spring为企业应用的开发提供了一个轻量级的解决方案。该方案包括：基于依赖注入的核心机、基于AOP的声明式事务管理、与多种持久层技术的整合，以及优秀的Web MVC框架等。Spring致力于JavaEE应用各层的解决方案，而不是仅仅专注于某一层的方案。可以说：Spring是企业应用开发的“一站式选择”，Spring贯穿表现层、业务层、持久层。然而，Spring并不想取代那些已有的框架，而是以高度的开放性与他们无缝整合。

2024-09-30 17:18:29 1204

原创 Require：完成一个局部随机，全局离散没有热点且唯一的数值Id生成器。

Require：基于雪花算法完成一个局部随机，全局离散切唯一的Id生成器。

2024-09-25 09:49:51 399

原创 Bug：ThreadPoolTaskScheduler搭配CronTask完成定时任务，关闭scheduler后CronTask任务仍然执行？

Bug：ThreadPoolTaskScheduler搭配CronTask完成定时任务，关闭scheduler后CronTask任务仍然执行？

2024-09-24 19:35:03 521

原创组成原理：体系结构，CPU，存储器，Cache

在计算机组成原理中，体系结构指的是计算机各个组件如何相互配合工作的整体设计。CPU（中央处理器）是计算机的核心，负责执行指令和处理数据。存储器则用于存储计算所需的数据和指令，分为主存（如RAM）和辅存（如硬盘）。Cache（缓存）是介于CPU和主存之间的高速存储器，用来暂存经常访问的数据，减少CPU直接访问主存的时间，从而提高系统的性能。

2024-09-12 09:04:43 1454

原创 JDK并发：锁（互斥锁，读写锁，公平锁，Condition，StampedLock）

在Java并发编程中，互斥锁、读写锁、Condition和StampedLock是四种重要的同步工具。互斥锁（ReentrantLock）用于确保只有一个线程可以访问共享资源；读写锁（ReadWriteLock）允许多个线程并发读取但写入时进行排他性控制；Condition提供了灵活的线程等待和通知机制；而StampedLock则通过乐观读锁、悲观读锁和写锁提供高效的锁管理。

2024-09-07 18:24:33 1634

原创 Linux：进程管理，任务管理，监控系统

在Linux系统中，进程管理、任务管理和系统监控是保障系统稳定性和性能的关键技能。进程管理涉及对系统中进程的创建、调度和终止，通过如ps和top等工具来查看和调整进程。任务管理使用工具如cron来安排和自动执行定期任务，从而提高操作效率。系统监控则通过工具如vmstat和iostat实时跟踪系统资源使用情况，帮助及时发现和解决潜在问题。

2024-08-15 09:14:15 969

原创 JDK并发：重排序，内存屏障，Atomic类，CAS，伪共享，Striped64

在Java并发编程中，理解内存屏障、Atomic类、CAS函数和伪共享是优化性能的关键。内存屏障用于确保多线程环境中的操作顺序，防止指令重排序导致的数据不一致问题。Java的Atomic类提供了一种无锁机制来实现线程安全的操作，通过原子性操作提高了性能。CAS（Compare-And-Swap）函数是原子操作的基础，允许线程安全地更新变量，避免了传统锁机制的开销。然而，伪共享问题可能导致性能下降，当多个线程访问的变量共享同一缓存行时，会引发频繁的缓存失效。

2024-08-15 08:59:15 1303

原创 Linux：文件管理，目录管理，文件系统，链接类型

在Linux操作系统中，文件和目录的管理是日常操作的核心。无论您是系统管理员还是开发者，掌握Linux中文件和目录的管理方法对于高效工作至关重要。本篇博客将深入探讨Linux中的文件管理、目录管理、文件类型及链接类型，帮助您熟练操作和管理您的系统资源。

2024-08-13 17:54:26 1445

原创 Linux：操作系统，快捷键，目录结构，关机重启

Linux操作系统因其稳定性、灵活性和开源特性，成为了许多开发者和系统管理员的首选。无论您是新手还是有经验的用户，了解Linux的基本操作、快捷键、目录结构及关机重启方法，对提高工作效率至关重要。本篇博客将为您详细介绍这些基础知识，帮助您更好地掌握Linux系统的使用。

2024-08-13 17:26:18 782

原创 Linux应用：Mysql（安装卸载，登录改密，远程连接，区分表名）

如果你希望掌握 MySQL 在 Linux 系统上的全面应用，这篇博客将是你的理想选择！我们将详细介绍如何从安装到卸载 MySQL，如何进行安全配置，如何修改登录密码，以及如何设置远程连接，让你能够高效管理数据库。我们还将探讨如何正确区分 MySQL 中的表名，以确保数据的准确性和一致性。不论你是新手还是有经验的开发者，这里都将为你提供实用的技巧和解决方案，帮助你优化数据库操作。

2024-08-11 20:56:58 451