自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 MiniMind 第 5 篇:《核心训练|单卡 3090 极速复现:预训练 + SFT 从零跑通》

普通人也能亲手训练一个可用的语言模型。训练过程中,你不仅能看到 Loss 一步步下降,还能见证模型从「只会词语接龙」到「能流畅对话」的神奇转变 —— 这种成就感,是调包使用大模型无法比拟的。建议大家动手修改训练参数(如学习率、batch size、序列长度),对比不同参数下的训练速度和模型效果,加深对小模型训练的理解。遇到问题不要怕,3090 单卡训练的容错率很高,大不了重新训练一次(也就 2 小时)。

2026-04-15 15:59:17 649

原创 MiniMind 第 4 篇:《数据工程|Tokenizer 训练 + 预训练 / SFT/DPO 全数据集处理》

参数量浪费:词嵌入层参数 = 词表大小 × 嵌入维度(如 32k×512=16.38M),占 MiniMind2-Small 总参数(26M)的 63%,导致模型「头重脚轻」;编码效率低:大词表适合多语言、复杂文本,MiniMind 聚焦中文对话,无需冗余词汇,小词表编码更快、更精准。词表大小:6400(仅为 Llama3 的 1/20);训练算法:SentencePiece(Unigram 模型),适合中文短文本拆分;核心目标:平衡「编码压缩率」和「模型参数量」。

2026-04-15 14:20:28 446

原创 MiniMind第 3 篇:底层原理|Decoder-Only 小模型核心:RMSNorm/SwiGLU/RoPE 极简吃透

选 Decoder-Only:省掉 Encoder,参数量减半;用 RMSNorm:省算力,训练更稳定;用 SwiGLU:提升表达能力,不增加太多计算;用 RoPE:支持长文本,无额外参数;预归一化:加速收敛,提升深层网络效果。在小模型的算力 / 参数量限制下,追求「性价比最高」的性能提升—— 这也是我们学习小模型的核心价值:不是死磕参数规模,而是理解「如何用最少的资源,实现最优的效果」。

2026-04-14 14:29:15 460

原创 MiniMind第 2 篇:破除大模型 “神秘感“, 环境搭建|Win/Linux 本地快速部署

《MiniMind轻量化大模型本地部署指南》摘要:本文详细介绍了开源项目MiniMind的全平台环境搭建方案,适配Windows/Linux系统,支持CPU/GPU运行。从源码拉取、虚拟环境配置、依赖安装到CUDA适配,提供了完整部署流程,重点解决了Git下载超时、依赖冲突、CUDA不匹配等常见问题。项目仅需4GB显存即可运行小模型,8GB显存可流畅训练,无需高端显卡。文章包含目录结构解析、环境校验方法及高频报错解决方案,为后续模型训练与微调奠定基础。通过轻量化配置打破大模型训练的高算力门槛,使普通PC也能

2026-04-14 11:04:09 531

原创 MiniMind第 1 篇:别再只会调包!3 元 + 2 小时从零训出 26M 对话小 LLM

大厂大模型动辄百亿参数,个人 GPU 跑不动、训练成本上万,连部署都难;想学底层原理,却被trl高度封装,10 行代码跑完训练,完全看不懂内部逻辑;网上教程要么付费割韭菜,要么漏洞百出,只能学 LoRA 微调, never 真正从零训一个模型;想入门 LLM,却找不到低成本、可复现、全开源、代码纯白盒的实战项目。今天给大家带来一个颠覆入门门槛的开源项目 ——MiniMind单卡 3090,2 小时训练,成本不到 3 块钱,就能从零训出一个25.8M 参数、具备完整对话能力的超小语言模型。

2026-04-13 20:06:44 711

原创 破除大模型 “神秘感“—— 低配电脑也能练出自己的模型

1、参数从 "最小" 开始试batch_size:RTX3050 4G 建议 4-8(超过必爆)hidden_size:64-128(再大显存扛不住)layers:2-4(层数越多,训练时间越长)2、显存不够就 "砍"优先砍 batch_size(最影响显存)再砍 hidden_size 和 layers(缩小模型)禁用多线程(--num_workers 0)、用 float16 精度3、部署不用强求标准格式自定义小模型直接加载.pth 运行最靠谱。

2026-04-13 14:38:51 897

原创 Cursor 免费版 vs Pro 版 功能对比表(2026 最新版)

表格。

2026-04-10 10:03:17 8384 1

原创 如何用个人电脑快速训练自己的语言模型?MiniMind 全流程实战指南

—— 项目作者 @jingyaogong。:无需企业级算力,仅需一张消费级显卡(如RTX 3090)、3元成本与2小时,即可从零训练一个64M参数的轻量语言模型。以上是建议硬件,我自己的笔记本是3050显卡,显存4g,训练64的会很慢,最终训练了一个更小的,主要是体验下整个过程。:本文代码实测环境:RTX 3050 + Windows11操作系统,所有截图及日志来自真实运行记录。如果你本机有其他很多依赖库,建议隔离安装,我是用的venv隔离环境。第一次爆显存了,调整参数后继续训练,将参数调小后可以了。

2026-04-10 10:00:28 734

原创 20 分钟教你零基础部署 OpenClaw 到 Windows 电脑

摘要: OpenClaw是一款本地运行的AI自动化工具,通过自然语言指令帮助用户完成电脑操作(如文件管理、系统配置、浏览器自动化等)。部署需Windows系统、Node.js环境及2GB存储空间,支持离线(Ollama)或在线(如硅基流动API)AI模型。安装步骤包括Node.js配置、OpenClaw安装、网关授权及模型设置,全程约20分钟。使用时输入清晰指令(如“删除G盘.log文件”),工具会自动解析执行。优势在于无需编程基础,数据本地存储,适合提升效率的普通用户和开发者。常见问题涵盖配置错误、端口冲

2026-03-11 10:16:52 918

原创 绝对有帮助!Windows+Office+IDE + 浏览器高频快捷键大全,少点鼠标多写代码

这些快捷键的核心不是 “炫技”,而是帮开发者 “减少无意义操作”—— 少点 10 次鼠标,就能多写 2 行代码;少拖 1 次数据,就能多测 1 个接口。建议收藏这篇,每天用 1-2 个快捷键,2-3 天就能形成肌肉记忆,慢慢你会发现:原来效率提升这么简单!

2025-08-27 14:42:36 998

原创 从 C# 到 Python:项目实战第五天的飞跃

在前面三天的学习中,我们已经掌握了 Python 的基础语法、数据结构以及一些核心库的使用。今天,我们将通过三个实战项目,深入对比 C# 和 Python 在命令行工具开发、Web 应用开发以及数据处理方面的差异,感受 Python 在实际项目中的强大魅力。

2025-07-21 21:11:50 1198

原创 c#转python第四天:生态系统与常用库

作为系列文章的第 4 篇,本文将聚焦 Python 生态中最具代表性的技术栈,通过与 C# 对应技术的横向对比,帮助开发者快速掌握 Python 在数据处理、Web 开发和异步编程领域的核心优势。无论是有 C# 基础想转 Python 的开发者,还是需要在两种语言间做技术选型的团队,都能从本文的对比分析中获得实战参考。

2025-07-20 22:25:00 2348

原创 从 C# 转 Python 第三天:文件操作、异常处理与错误日志实践

本文将深入剖析 Python 和 C# 在文件操作与异常处理方面的技术细节,通过细致的对比和丰富的实例,为读者呈现这两门语言在这些关键领域的异同点,助力大家在实际项目中做出更明智的技术选择 。

2025-07-19 20:43:38 1396

原创 从 C# 到 Python:6 天极速入门(第二天)

我们在第一天已经掌握了 Python 的基础语法框架的基础上,今天我们将深入 Python 的特色语法与高级特性,通过实际项目开发场景的代码对比,理解这些特性在真实业务中的应用价值。

2025-07-18 14:15:33 749

原创 从C#6天学会Python:速通基础语法(第一天)

本文记录了我作为一名C#开发者转学Python的第一天学习心得。通过对比两种语言的语法差异,快速掌握Python核心特性。

2025-07-17 17:13:22 1267

原创 解锁PCAgent:AI驱动的自动业务运行新时代,颠覆你的认知(第一课)

通过本文的介绍,我们深入了解了 PCAgent 借助 AI 智慧大脑实现自动业务运行的强大能力。从打破传统操作模式的概念创新,到详细的部署步骤,再到丰富多样的应用场景,PCAgent 展现出了在提升工作效率、解放人力方面的巨大潜力。其主动感知模块和层次化多智能体协作结构的设计,为复杂任务的自动化执行提供了坚实的技术支撑。

2025-07-07 21:23:03 907

原创 SQL Server 进阶语法实战:从动态透视到存储过程的深度应用(第四课)

在SQL Server 再进阶:类型多样性分析与时间维度扩展》基础上,我们跳出传统聚合框架,探索 SQL Server 特有的高级语法特性,包括动态透视PIVOT、数据清洗正则函数、T-SQL 存储过程优化,以及基于执行计划的查询调优。这些技术可解决动态列生成、不规则数据清洗、批量自动化处理等复杂场景,实现从数据处理到架构设计的升级。

2025-07-04 21:53:22 1094

原创 YOLOv8 模型转换 ONNX 后 C# 调用异常:一个参数引发的跨平台适配难题

​作为一名 C# 开发者,我在完成 YOLOv8 模型训练(使用 Ultralytics 官方框架,训练数据为自定义目标检测数据集,输入尺寸 640x640,训练轮次 100 轮)后,希望将训练好的best.pt模型部署到 C# 开发的桌面应用中。按照常规流程,我通过以下代码将模型转换为 ONNX后,无法在C#中正确识别结果,针对这一问题我是如何一步步解决的,如果你也遇到了类似问题,相信肯定可以帮到你。

2025-07-03 16:37:23 1712

原创 SQL Server 再进阶:类型多样性分析与时间维度扩展(第三课)

掌握递归 CTE、CASE WHEN与窗口函数的组合用法,相当于掌握了 SQL Server 树形数据处理的核心技巧,可应对多数复杂业务场景。后续可进一步探索 XML/JSON 数据处理、机器学习集成等高级功能,持续挖掘数据库的潜力。

2025-07-02 23:32:53 1188

原创 SQL Server 进阶:递归 CTE+CASE WHEN 实现复杂树形统计(第二课)

通过递归 CTE 构建层级关系、CASE WHEN实现条件聚合、分组函数完成数据汇总,我们在 SQL Server 中实现了真正的层级递归统计。这种方案不仅能处理复杂的组织架构数据,还能灵活扩展统计维度,相比传统编程方式大幅减少代码量,提升开发效率与数据处理性能。

2025-07-01 23:19:42 1217

原创 SQL Server 函数实战:一条 SQL 替代 3000 行代码的计算逻辑(第一课)

在 SQL Server 的开发过程中,合理运用CASE WHEN和递归 CTE 等特性,能够极大提升开发效率。借助CASE WHEN(类似于 Oracle 的DECODE)函数与分组函数的巧妙配合,我们也能够仅用一条 SQL 语句,实现原本需要 3000 行代码才能完成的复杂计算逻辑。

2025-07-01 23:06:44 939

原创 Oracle 进阶语法实战:从多维分析到数据清洗的深度应用​(第四课)

这些技术尤其适合数据密集型企业应用(如人力资源管理、供应链分析),能显著减少 ETL 流程中的代码量,提升复杂统计的开发效率。掌握 Oracle 进阶语法的核心,在于理解其设计哲学 —— 将数据库作为数据处理的核心引擎,而非简单的数据存储层。通过合理组合这些高级特性,开发者能构建出兼具灵活性和高性能的数据解决方案。

2025-06-30 22:48:22 1214

原创 Oracle 树形统计再进阶:类型多样性与高频类型分析(第三课)

对于企业级 HR 系统、OA 平台等场景,这种深度统计能力能有效减少后端代码量(避免多次往返数据库),同时提供实时业务洞察。掌握DECODE+ 递归 + 高级聚合函数的组合,相当于掌握了 Oracle 数据分析的 “瑞士军刀”,能应对 80% 以上的树形结构统计需求。

2025-06-30 22:36:05 1302

原创 Oracle 递归 + Decode + 分组函数实现复杂树形统计进阶(第二课)

一种神级的SQL计算逻辑,适合组织架构复杂、层级统计频繁的企业级应用(如人力资源管理、财务成本分摊等场景)。掌握递归与DECODE的组合使用,能让你在处理树形数据时如虎添翼,真正发挥 Oracle 数据库的原生优势。如果你能学会这种SQL逻辑,相信我,肯定会对你在实际工作中有巨大帮助。欢迎关注留言,期待与您一起进步。

2025-06-29 23:42:40 1413

原创 马斯克的 Neuralink:当意念突破肉体的边界,未来已来

在硅谷的实验室里,一场关于人类进化的革命正在悄然发生。埃隆・马斯克(Elon Musk)旗下的 Neuralink 公司,用微米级的电极和人工智能算法,将科幻电影中的「意念控制」变成了现实。这个成立于 2016 年的神经科技公司,正以惊人的速度改写着人类与技术的关系,让我们看到了一个没有肢体障碍、意识自由驰骋的未来。

2025-06-29 00:06:09 2851

原创 Oracle 神级函数 Decode 实战:一条 SQL 替代 3000 行代码的计算逻辑​

在企业级应用开发中,复杂的业务统计需求往往需要编写大量代码进行数据处理。本文将通过 Oracle 的DECODE函数与分组函数的巧妙结合,展示如何用一条 SQL 语句实现原本需要 3000 行代码的复杂计算逻辑,尤其针对企业组织架构中的部门级请假数据统计场景。

2025-06-28 22:39:34 1470

原创 Oracle 递归查询进阶:一个 SQL 顶替 5000 行程序代码,高效处理树形数据

本文系统介绍了Oracle递归查询的核心语法与应用场景。主要内容包括:1.基础语法:通过STARTWITH和CONNECTBYPRIOR实现树形结构查询,使用LEVEL、CONNECT_BY_ROOT等伪列获取层级信息;2.进阶应用:分别演示向下递归(查询子节点)、向上递归(查询父节点链)和WITH递归子查询的实现方法。

2025-06-28 21:51:16 1025

原创 Emgu.CV+AI大模型+C#,让你的图像识别在算法的基础上更加智能化

在软件运维和游戏领域可以利用 Emgu.CV、大模型和 C# 相结合的技术,能够实现一系列自动化操作。本文详细向你介绍具体的实现思路和实现原理。

2025-06-27 22:42:10 921

原创 ViGEmBus + C#:解锁Xbox手柄模拟新姿势,告别键盘消息限制!

本文介绍了使用ViGEmBus+C#实现Xbox手柄模拟的技术方案。该方案通过ViGEmBus驱动程序模拟Xinput和DirectInput协议,让系统将虚拟设备识别为真实控制器。C#通过ViGEmClient库与驱动交互,实现手柄按键、摇杆等操作的模拟控制。相比传统键盘消息模拟方式,该方案不受系统热键和输入法干扰,避免游戏检测,具有更高的精准度和稳定性。

2025-06-27 22:11:08 1774

原创 大模型一直在用,但是大模型有什么类型还分不清?一文教你弄清大模型的分类

从语言到视觉,从单模态到多模态,AI 大模型正以多样化的形态重塑我们的生活与工作方式。不同类型的大模型各有所长,通过协同应用,将为人工智能的发展注入源源不断的动力。希望本文能帮助你对 AI 大模型类型有更清晰的认知,也期待更多开发者加入大模型技术的探索与创新中! 

2025-06-26 20:26:36 721

原创 高考志愿不会填? AI 帮你填写高考志愿,手把手教你完成志愿填报

高考志愿填报是人生重要的转折点, AI 就像一位 “智能参谋”,能帮你快速理清思路、筛选信息。但记住:最终选择权在自己手中!多和老师、学长学姐交流,亲自查阅院校官网,综合判断,才能填出一份不留遗憾的志愿表!祝所有考生都能被理想院校录取,开启闪闪发光的大学生活!​愿你步履生花,未来可期,选到钟意的学校和专业。

2025-06-26 14:32:55 1500

原创 AI 智能运维,重塑大型企业软件运维:从自动化到智能化的进阶实践​

AI 正在重新定义企业软件运维的价值边界,从效率工具升级为业务创新的赋能引擎。面对智能运维的独特挑战,建议企业采取 "工具先行 - 流程重塑 - 能力沉淀" 的三步法:​优先部署 OMNITOOL、Manus 等轻量化运维机器人,快速解决日常巡检、工单处理等重复性工作,缓解人员兼职压力,确保响应时效达标;​基于数字员工运行数据优化运维流程,建立 "AI 预处理 - 人工核验 - 知识反哺" 的新型协作机制,重构适合云环境的运维体系​。

2025-06-25 15:21:54 2050

原创 人脑 vs AI:一场耗能相差50万倍的智慧竞赛,当硅基智能决定重走碳基进化之路,我们如何跨越鸿沟?

人脑就是经过38亿年训练的终极AI——而现在,我们正教会AI重走这条进化之路。在人工智能飞速发展的今天,我们常常惊叹于AI的强大能力,却忽略了自然界最精妙的智能系统——人脑。这场碳基与硅基的智慧较量,不仅是性能的比拼,更是两种截然不同的进化路径的对话。本文将揭示人脑令人震撼的能效优势,剖析当前AI的致命短板,并探索如何通过神经拟态计算、具身智能和脑机接口三条路径,实现两种智能形态的共生融合。

2025-06-25 10:42:21 1675

原创 30 分钟掌握 Docker+MySQL 部署:告别环境配置地狱,容器化开发如此简单!

Docker 如何重塑开发与运维开发效率:告别 “本地正常,线上崩溃” 的噩梦,环境一致性得到保障。30分钟让你完成本地Mysql服务器端部署和使用。

2025-06-24 17:45:24 1814

原创 让你1小时学会Oralce,熟悉SqlServe,但没用过Oracle,应该如何快速掌握Oracle语法?

对于很多刚毕业的学生来说,只要是软件方向的应该基本上都学过SQL Server,可能很多没有接触过Oracle。我们将从最基本的查询语句开始,一直深入到递归函数等高级特性,让你在1小时内建立起Oracle语法的整体认知框架。

2025-06-24 12:03:01 2591

原创 如果你想了解、使用、精通AI,你应该知道哪些基础概念?以deepseek、ollama、chatbox、dify之间的关系详细介绍

AI 技术的发展日新月异,DeepSeek、Ollama、Chatbox 和 Dify 构成了从模型到应用的完整生态链。通过理解基础概念、掌握核心工具、实践协同开发,开发者可以快速将 AI 能力融入业务场景,实现效率提升和创新突破。无论是个人开发者还是企业用户,都能在这个生态中找到适合自己的路径,从入门到精通,成为 AI 时代的技术推动者。

2025-06-23 21:47:17 940

原创 AI帮我解决工作生活中的1件小事,教你如何利用AI工具来解决你实际遇到的问题,并产生价值

AI帮我解决PDF文件太大,无法打印,帮我开发压缩PDF工具。这次用 AI 解决打印问题只是一个开始,未来我还会继续探索 AI 在工作和生活中的更多应用。如果你也有类似的问题,或者想了解更多 AI 的实战经历,欢迎关注。让我们一起探索 AI 的世界,利用 AI 工具创造更多的价值,期待与你一起进步

2025-06-23 16:38:52 770

原创 个人笔记本尝试AI大模型,手把手教你用Ollama本地部署DeepSeek,并学会如何调用

作为一名深耕软件行业项目的工作者,近年来目睹了 AI 大模型领域的蓬勃发展与持续升温。从 ChatGPT 引发的全球热潮,到各类大模型产品如雨后春笋般涌现,我心中始终萦绕着对大模型的好奇:大模型究竟是什么?它的工作原理是怎样的?又能在实际场景中发挥哪些作用?为了探寻这些问题的答案,我决定从本地部署入手,亲自尝试搭建一个大模型环境,深入了解其运作机制,而 Ollama 和 DeepSeek 的组合成为了我的首选。个人笔记本配置不高,4g显存,16g内存,进行了初步尝试。

2025-06-22 23:34:11 1531

原创 .NET开发转JAVA、Python有压力?AI成为你的智慧大脑,让你精通各种语言。以合并PDF功能为例,让你1小时掌握其他语言

在信创化国产要求不断提高的背景下,.NET 开发人员转向 JAVA、Python 等语言虽然面临一定压力,但 AI 大模型的出现为我们提供了强大的支持。它让开发语言转换变得更加简单高效,让我们能够在具体项目中快速应用新语言,实现功能开发。随着 AI 技术的不断发展,它将成为开发人员精通各种编程语言的有力工具,帮助我们在技术发展的浪潮中始终保持竞争力,轻松成为精通多种编程语言的专家。

2025-06-22 22:12:27 1236

原创 CAS认证集成太复杂?只需30行代码让你的应用系统快速完成与CAS集成,而不对原系统进行大量改造

摘要:针对企业已有CAS服务器的应用场景,提出了一种仅需30行代码的轻量级集成方法,保留了原系统的Form认证机制。方案核心在于处理ticket生成和用户信息获取两个关键点,通过CAS服务器交互实现统一认证。作者详细解释了单系统和多系统集成的两种场景实现原理,并提供了具体的接口调用方式和XML解析方法。该方案无需底层改造系统架构,大幅减少了开发和测试工作量,具有简单、安全、易实施的特点。

2025-06-21 23:41:46 784

统一认证CAS单点集成,30行代码实现CAS认证集成,10分钟完成CAS认证集成,避免大量改造你的业务底层逻辑

按照以前项目集成惯例,以及结合网上CAS一些集成方案,如果要实现集成需要从底层修改我们现在的逻辑,改造工作量很大,需要对每个代码的身份认证都进行替换和改造,另外就是改造后测试工作量也很多。这里我要说的是如何用30行代码完成整个项目的快速集成,让你10分钟内完成与CAS认证集成,而不必花费几个周的时间进行改造和测试。

2025-06-24

JSON离线本地编辑器,小巧,免安装,在任何Windows操作系统上都可用

JSONedit 是一款轻量级 JSON 编辑工具,以树形结构可视化展示数据,支持智能格式校验与自动补全,具备增删改查、一键格式化、JSONPath 查询等功能,可导入导出多种格式,跨平台易用,适合 API 调试、配置文件编辑等场景 。

2025-06-24

用c#编写的合并pdf小程序,解决你pdf收费软件才能合并的困惑

由于经常需要用到PDF合并功能,很多PDF工具都需要开通会员后才能使用合并PDF功能,就用自己擅长的C#语言编写了一个,希望能方便大家使用帮助大家。程序是源码,在HeBingPDF\bin\Debug下有编译好的HeBingPDF.exe,将整个Debug文件夹拷贝到任何电脑上即可直接使用。

2025-06-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除