- 博客(386)
- 资源 (21)
- 收藏
- 关注
原创 Fine-tuning:微调技术,训练方式,LLaMA-Factory,ms-swift
本文系统介绍了大语言模型微调技术及其训练方式。主要内容包括:1. 微调技术对比:从Full-tuning(全参数微调)、Freeze-tuning(冻结微调)到LoRA(低秩适配)和QLoRA(量化低秩适配),分析了各类方法的参数规模、显存需求、性能表现及适用场景。2. 训练方式详解:涵盖预训练、监督微调、奖励建模以及PPO、DPO等强化学习优化方法,比较了不同训练阶段的标签需求、人类偏好使用和算法特点。3. LLaMA-Factory实践指南:提供从环境配置、量化选择到数据集准备和训练参数设置的完整流程,
2025-05-27 15:03:32
793
原创 TTS:VITS-fast-fine-tuning 快速微调 VITS
VITS-fast-fine-tuning是基于VITS开发的一站式多角色模型微调工具,允许用户在不到1小时内完成模型微调,实现指定音色的语音合成和声音克隆。本地部署需要安装Python 3.8、CMake、C/C++编译器和ffmpeg,并下载预训练模型和辅助数据。训练过程中可能遇到多种报错,如尺寸不匹配、模块缺失等,需根据具体情况进行调整和解决。
2025-05-22 09:59:41
522
原创 TTS:F5-TTS,MegaTTS3
F5-TTS是一款在英文生成领域表现卓越的文本转语音(TTS)工具,其发音标准程度在评测中名列前茅。该工具支持多角色生成模式,能够一次性为多个角色和情绪生成对话式语音,功能独特。F5-TTS的最低配置要求低,无需显卡,仅需CPU即可推理生成,且生成速度在所有TTS工具中耗时最低。项目启动方式包括傻瓜式启动和部署式启动,用户可以通过简单的命令行操作快速启动服务。F5-TTS支持流式匹配,能够模仿流利、忠实的语音,适用于童话故事机等场景。此外,E2TTS作为其功能之一,提供了简单且非自回归的零样本TTS功能。
2025-05-17 17:00:40
388
原创 DeepSearch:WebThinker开启AI搜索&研究新纪元!
WebThinker是一个创新的深度研究智能体,旨在通过自主搜索网络、导航网页并撰写研究报告,显著提升知识密集型领域的研究效率。该项目利用检索增强生成(RAG)技术,但突破了传统RAG的局限,实现了端到端的任务执行,无需遵循预设的工作流程。WebThinker的核心优势在于其能够在单次生成中自主调用工具,进行深度思考和连贯性操作,从而大幅降低信息收集的时间和成本。
2025-05-16 20:55:26
678
原创 DeepSearch:字节新一代 DeerFlow 框架
DeerFlow是一个基于LangChain和LangGraph的开源Multi-Agent框架,旨在提升多智能体系统的执行效率和灵活性。其核心特性包括独家设计的ResearchTeam机制,支持多轮对话、决策和任务执行,显著减少Tokens消耗和API调用次数。DeerFlow采用MetaPrompt模式,由大模型自动生成高质量Prompt,降低Prompt工程门槛。此外,用户可通过自然语言实时修改和优化AI生成的内容。DeerFlow还支持生成播客和PPT。
2025-05-15 18:00:28
958
原创 Qwen:Qwen3,R1 在 Text2SQL 效果评估
Qwen3235B-A22B是综合性能最强的模型,尤其在复杂推理和代码生成任务中表现突出,而Qwen3-32B和30B-A3B则是经济高效的替代方案。其他模型在特定任务中表现良好,但整体性能相对较弱。
2025-05-12 19:48:38
858
原创 TTS:CosyVoice2 高质量语音克隆
CosyVoice2 只需3~10秒的原始音频,即可生成克隆音色,实现不同语言之间的语音合成,中文、英文、日语、韩语、中国方言(粤语、四川话、上海话、天津话、武汉话、长沙话、郑州话等),还支持生成具有多种情感表达的语音,包括快乐、兴奋、悲伤、愤怒等,还能通过指令控制说话的语气、情绪等
2025-04-28 10:46:21
841
原创 TTS:VITS 模型本地训练操作指南
VITS(Variational Inference Text-to-Speech)是由韩国NAVER的研究团队提出的一种端到端的文本到语音(TTS)生成模型。VITS 融合了 变分自编码器(VAE)、GAN(生成对抗网络) 和 非自回归建模 的思想,能够在保持高语音质量的同时,实现快速的语音合成。
2025-04-24 14:26:53
935
翻译 STRUCTBERT:将语言结构融入预训练以提升深度语言理解
受到Elman线性化探索工作的启发,我们在BERT的基础上提出了一种新模型StructBERT,通过在预训练过程中融入语言结构来提升表现。具体而言,我们为StructBERT设计了两个辅助任务,以充分利用单词和句子的顺序信息,从而在词级和句子级别上利用语言结构。这使得新模型能够适应下游任务所需的不同层次的语言理解能力。
2025-03-27 10:31:35
1231
1
原创 AIGC:Wan 2.1,CogView 4,BLIP3o
随着AIGC技术的不断突破,新一代模型纷纷登场,展现出更强的图文生成与理解能力。本文聚焦三款具有代表性的模型:Wan 2.1、CogView 4 和 Index-AniSora。我们将简要介绍它们的架构演进、核心特性以及在多模态生成、图像质量、风格控制等方面的表现差异,并结合实际案例评估其在AIGC应用场景中的实用价值。通过横向对比,帮助读者更好地理解当前AIGC前沿动态,把握未来创作与内容生产的新趋势。
2025-03-18 09:12:34
250
原创 DeepSeek-R1:通过强化学习激发LLMs的推理能力
我们介绍我们的第一代推理模型:DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习(RL)训练的模型,在此过程中未采用监督微调(SFT)作为初步步骤,它展现出了卓越的推理能力。通过强化学习,DeepSeek-R1-Zero 自然涌现出许多强大且有趣的推理行为。然而,它也面临一些挑战,例如可读性较差和语言混杂等问题。为了解决这些问题并进一步提升推理性能,我们引入了 DeepSeek-R1,该模型在强化学习之前结合了多阶段训练和冷启动数据。
2025-02-08 11:10:42
1058
原创 Require:CDS、CRaC & GraalVM 加速 SpringBoot 启动速度
CDS 通过在 JVM 启动时预加载常用的类数据并将它们共享在多个 JVM 实例之间来优化性能。这些类数据包括类的元数据、方法、常量池等。它是 OpenJDK(JDK 5 开始) 主线中成熟且可用于生产的技术,与 GraalVM 和 Project CRaC 相比,它更易于使用,因为它具有较少的限制和副作用。
2025-01-23 11:06:59
716
原创 Require:利用MySQL binlog实现闪回操作
MySQL binlog以event的形式,记录了MySQL server从启用binlog以来所有的变更信息,能够帮助重现这之间的所有变化。MySQL引入binlog主要有两个目的:一是为了主从复制;二是某些备份还原操作后需要重新应用binlog。
2025-01-13 19:13:40
904
原创 JVM:ZGC详解(染色指针,内存管理,算法流程,分代ZGC)
ZGC 的核心是一个并发垃圾收集器,所有繁重的工作都在Java 线程继续执行的同时完成。这极大地降低了垃圾收集对应用程序响应时间的影响。ZGC为了支持太字节(TB)级内存,设计了基于页面(page)的分页管理(类似于G1的分区Region);ZGC为了能够快速对对象进行并发标记和并发移动,对内存空间重新进行了划分,这就是ZGC中新引入的指针染色;仅支持 Linux 64 位系统,不支持 32 位平台。因此也不支持压缩指针。同时ZGC为了能更加高效地管理内存,设计了物理内存和虚拟内存两级内存管理。
2025-01-13 10:00:50
2324
原创 Bug:@ConditionalOnProperty居然不影响@Import?
结论:@ConditionalOnProperty 肯定影响 @Import!但是为啥实际项目中出现了@ConditionalOnProperty的类不加载,@Import类加载的情况?
2025-01-10 14:30:17
222
原创 Require:Helm/K3S 离线部署 Sourcegrapha
当使用 INSTALL_K3S_SKIP_DOWNLOAD 环境变量运行 K3s 脚本时,K3s 将使用本地的脚本和二进制。helm在解压后的目录中找到二进制文件,然后将其移至所需的目标位置,这样任何目录都可以使用 helm。要在单个服务器上安装 K3s,只需在 server 节点上执行以下操作。导航代码、查找引用、查看代码所有者、跟踪历史记录等。一次对许多存储库进行大规模更改并跟踪大规模迁移。搜索所有分支和所有代码主机的所有存储库。
2024-12-24 20:26:25
671
原创 JVM:堆内外存泄露排查
为了优化Java的性能 ,JVM在解释器之外引入了即时(Just In Time)编译器:当程序运行时,解释器首先发挥作用,代码可以直接执行。随着时间推移,即时编译器逐渐发挥作用,把越来越多的代码编译优化成本地代码,来获取更高的执行效率。解释器这时可以作为编译运行的降级手段,在一些不可靠的编译优化出现问题时,再切换回解释执行,保证程序可以正常运行。即时编译器极大地提高了Java程序的运行速度,而且跟静态编译相比,即时编译器可以选择性地编译热点代码,省去了很多编译时间,也节省很多的空间。
2024-11-28 16:26:18
2872
1
原创 Bug:引入Feign后触发了2次、4次ContextRefreshedEvent
Bug:引入Feign后发现监控onApplication中ContextRefreshedEvent事件触发了2次或者4次。
2024-11-21 19:38:45
1254
原创 操作系统:线程(基本概念,内核线程,用户线程,通讯方式)
【内核级线程(内核管理)】指的是在内核支持下运行的,即无论是用户进程中的线程,还是系统进程中的线程,对应的 TCB 自然是放在操作系统里的,它们的创建、撤销和切换等也是依靠内核,在内核空间实现的。内核线程的数量=CPU的核心数。【用户级线程】仅存在于用户空间中。对于这种线程的创建、撤销、线程之间的同步与通信等功能,都无须利用系统调用来实现。对于用户级线程的切换,通常发生在一个应用进程的诸多线程之间,这时,也同样无须内核的支持。
2024-11-19 10:27:43
1072
原创 Spring:Bean(创建方式,抽象继承,工厂Bean,生命周期)
Spring可以管理singleton作用域的Bean的生命周期,Spring可以精确地知道该Bean何时被创建、何时被初始化完成、容器何时准备销毁该Bean实例。
2024-11-05 09:17:35
803
原创 Spring:Bean(基本定义,作用域,各类注入,自动装配,注解)
对于开发者来说,开发者使用Spring框架主要是做两件事:(1)开发Bean。(2)配置Bean。对于Spring框架来说,它要做的就是根据配置文件来创建Bean实例,并调用Bean实例的方法完成“依赖注入”——这就是IoC的本质。其实Spring框架的本质就是,通过XML配置来驱动Java代码,这样就可以把原本由Java代码管理的耦合关系,提取到XML配置文件中管理,这就实现了系统中的各组件的解耦,有利于后期的升级和维护。
2024-11-05 09:01:17
708
原创 Java:类集(HashMap,Map子类,ConcurrentSkipListMap)
2w字吐血整理Java:类集(HashMap,Map子类,ConcurrentSkipListMap,ConcurrentHashMap,LinkedList,Hashtable,SortedMap,TreeMap,IdentityHashMap)
2024-10-30 15:54:19
661
原创 Java:线程池(底层原理,延迟&周期,ForkJoinPool,CompletableFuture)
2w字吐血整理,Java:多线程(线程池,工作流程,拒绝策略,参数详情,队列大小设置,任务执行原理,任务提交原理,优雅停止,延迟执行,周期执行)。包括:基础知识,底层原理,代码复现,面试难点,刁钻问题解答。
2024-10-29 09:31:00
837
原创 Bug:通过反射修改@Autowired注入Bean的字段,明确存在,报错 NoSuchFieldException
Bug:通过反射修改@Autowired注入Bean的字段,明确存在,报错 NoSuchFieldException
2024-10-17 16:42:17
418
原创 JDK并发:同步工具类(Stemaphore,CountDownLatch,CyclicBarrier,Exchanger,Phaser)
在现代Java开发中,处理并发问题至关重要,而同步工具类是实现高效多线程程序的关键。本博客将深入探讨Java中的多种同步工具,包括信号量、等待完成、阶段同步、Exchanger和Phaser。我们将逐一解析这些工具的使用场景及其背后的原理,帮助你更好地理解它们在并发控制中的角色。无论你是Java新手还是经验丰富的开发者,本文都将为你提供实用的知识和技巧,助你在并发编程的世界中游刃有余。
2024-10-09 09:07:42
619
原创 Spring:基本概念,管理Bean,核心问题
Spring为企业应用的开发提供了一个轻量级的解决方案。该方案包括:基于依赖注入的核心机、基于AOP的声明式事务管理、与多种持久层技术的整合,以及优秀的Web MVC框架等。Spring致力于JavaEE应用各层的解决方案,而不是仅仅专注于某一层的方案。可以说:Spring是企业应用开发的“一站式选择”,Spring贯穿表现层、业务层、持久层。然而,Spring并不想取代那些已有的框架,而是以高度的开放性与他们无缝整合。
2024-09-30 17:18:29
1200
原创 Require:完成一个局部随机,全局离散没有热点且唯一的数值Id生成器。
Require:基于雪花算法完成一个局部随机,全局离散切唯一的Id生成器。
2024-09-25 09:49:51
397
原创 Bug:ThreadPoolTaskScheduler搭配CronTask完成定时任务,关闭scheduler后CronTask任务仍然执行?
Bug:ThreadPoolTaskScheduler搭配CronTask完成定时任务,关闭scheduler后CronTask任务仍然执行?
2024-09-24 19:35:03
520
原创 组成原理:体系结构,CPU,存储器,Cache
在计算机组成原理中,体系结构指的是计算机各个组件如何相互配合工作的整体设计。CPU(中央处理器)是计算机的核心,负责执行指令和处理数据。存储器则用于存储计算所需的数据和指令,分为主存(如RAM)和辅存(如硬盘)。Cache(缓存)是介于CPU和主存之间的高速存储器,用来暂存经常访问的数据,减少CPU直接访问主存的时间,从而提高系统的性能。
2024-09-12 09:04:43
1446
原创 JDK并发:锁(互斥锁,读写锁,公平锁,Condition,StampedLock)
在Java并发编程中,互斥锁、读写锁、Condition和StampedLock是四种重要的同步工具。互斥锁(ReentrantLock)用于确保只有一个线程可以访问共享资源;读写锁(ReadWriteLock)允许多个线程并发读取但写入时进行排他性控制;Condition提供了灵活的线程等待和通知机制;而StampedLock则通过乐观读锁、悲观读锁和写锁提供高效的锁管理。
2024-09-07 18:24:33
1633
原创 Linux:进程管理,任务管理,监控系统
在Linux系统中,进程管理、任务管理和系统监控是保障系统稳定性和性能的关键技能。进程管理涉及对系统中进程的创建、调度和终止,通过如ps和top等工具来查看和调整进程。任务管理使用工具如cron来安排和自动执行定期任务,从而提高操作效率。系统监控则通过工具如vmstat和iostat实时跟踪系统资源使用情况,帮助及时发现和解决潜在问题。
2024-08-15 09:14:15
969
原创 JDK并发:重排序,内存屏障,Atomic类,CAS,伪共享,Striped64
在Java并发编程中,理解内存屏障、Atomic类、CAS函数和伪共享是优化性能的关键。内存屏障用于确保多线程环境中的操作顺序,防止指令重排序导致的数据不一致问题。Java的Atomic类提供了一种无锁机制来实现线程安全的操作,通过原子性操作提高了性能。CAS(Compare-And-Swap)函数是原子操作的基础,允许线程安全地更新变量,避免了传统锁机制的开销。然而,伪共享问题可能导致性能下降,当多个线程访问的变量共享同一缓存行时,会引发频繁的缓存失效。
2024-08-15 08:59:15
1302
原创 Linux:文件管理,目录管理,文件系统,链接类型
在Linux操作系统中,文件和目录的管理是日常操作的核心。无论您是系统管理员还是开发者,掌握Linux中文件和目录的管理方法对于高效工作至关重要。本篇博客将深入探讨Linux中的文件管理、目录管理、文件类型及链接类型,帮助您熟练操作和管理您的系统资源。
2024-08-13 17:54:26
1445
原创 Linux:操作系统,快捷键,目录结构,关机重启
Linux操作系统因其稳定性、灵活性和开源特性,成为了许多开发者和系统管理员的首选。无论您是新手还是有经验的用户,了解Linux的基本操作、快捷键、目录结构及关机重启方法,对提高工作效率至关重要。本篇博客将为您详细介绍这些基础知识,帮助您更好地掌握Linux系统的使用。
2024-08-13 17:26:18
782
原创 Linux应用:Mysql(安装卸载,登录改密,远程连接,区分表名)
如果你希望掌握 MySQL 在 Linux 系统上的全面应用,这篇博客将是你的理想选择!我们将详细介绍如何从安装到卸载 MySQL,如何进行安全配置,如何修改登录密码,以及如何设置远程连接,让你能够高效管理数据库。我们还将探讨如何正确区分 MySQL 中的表名,以确保数据的准确性和一致性。不论你是新手还是有经验的开发者,这里都将为你提供实用的技巧和解决方案,帮助你优化数据库操作。
2024-08-11 20:56:58
451
原创 MyBatis:Maven,Git,TortoiseGit,Gradle
2w字吐血整理 MyBatis(Maven安装,pom.xml,脚手架,Git下载安装,TotoiseGit配置,添加/修改/删除文件,查看/切换文件版本,创建/切换/合并分支,Gradle安装,groovy语言)。
2024-08-07 17:43:57
1275
原创 MySQL:索引,B树&B+树,存储引擎
2w说明白MySQL:索引原则,Explain,索引分类,回表操作,Hash索引,B树索引,B+树索引,MyISAM,InnoDB,表空间。
2024-08-06 15:18:09
1442
原创 MySQL:架构缓存,事务,锁机制,SQL优化,分库分表
2w字说明白MySQL:MySQL架构,SQL执行过程,三范式,缓存,ACID,传播行为,隔离级别,死锁,乐观锁锁&悲观锁,SQL优化,分库分表分区。
2024-08-06 15:00:23
1487
国防科技大学机器学习(刘新旺)课程完整笔记(复习资料)
2024-07-31
需求分析阶段结束之前,系统分析员应该写出软件需求规格说明书,以书面的形式准确地描述软件需求
2022-11-21
Spring-Mybatis.zip
2019-09-19
spring-struts.zip
2019-06-10
spring-hibernate-struts2.zip
2019-06-10
spring - aop.zip
2019-06-10
spring-hibernate.zip
2019-06-10
整合案例.docx
2019-06-09
jsp应用与开发技术第二版课后习题配套答案
2019-01-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人