自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(159)
  • 收藏
  • 关注

原创 大模型分享会讲稿:理解上下文,理解大模型

第一,模型是"石化"的。训练完成后能力就固定了,它不会进化、不会记忆、也不会自己调用任何程序,本质只是"文字进,文字出"。第二,它靠概率抽签。同样的输入之所以有不同输出,是因为它从一张固定的概率表里随机选词,温度控制随机的大小。第三,上下文就是它的全部世界。它就像一个大小固定的 U 盘,你们所有的交流都在里面进行。你放进去什么,直接决定它算出什么。所以,想要好的输出,先给出好的输入。

2026-07-03 17:16:51 378 2

原创 让 AI 全托管你的项目:基于 SSH Key + GitHub CLI 的全自动化协作流程

能力所需配置协议clonepullpushSSH KeySSH创建 PR / Issue / ReviewghHTTPS API代码传输靠 SSH,平台操作靠 Token,两者缺一不可。Token 是密码,永远不要写进代码、日志或截图。一旦泄露,立刻去 https://github.com/settings/tokens 撤销。希望这篇文章能帮你顺利搭建起 AI 全托管你项目的自动化流水线。

2026-06-16 18:17:30 201

原创 一次 Ubuntu 内核升级翻车的运维记录:从 Kernel Panic 到锁定 6.14 内核

阶段现象/动作结论表象重启 Kernel Panic,内核找不到根分区定位环境lsblk -fdf -h旧系统在 NVMe,数据都在,问题在启动层救援尝试用第二系统 chroot,重建 initramfs + grub-install引导修好,但默认仍崩真相手动选 6.14 能进;显示 6.17 缺 initrd病根是 6.17 内核装残 + GRUB 默认选最新内核解决改锁定 6.14 + update-grub重启自动进 6.14,问题解决加固。

2026-06-11 16:00:39 883

原创 哎?我的git提交有cursor作为co-author,如何关闭?

(没有特别要求的话,个人是推荐打开的,因为使用agent编程没什么丢人的,而且有问题你也可以说,哎呀,你看这是AI的问题)开发的时候有同学会发现自己的git提交会有cursor的爪印,但是代码里的注释完全没有cursor,找来找去找不到原因。其实,在agents,attribution关闭这两个即可。

2026-06-11 13:51:30 303

原创 钉钉认证接入实践:第三方网站扫码登录与企业内用户身份转换(上篇)

1. 让钉钉确认扫码的人是谁2. 把钉钉账号身份 unionId 转成企业内 userId3. 把 userId 写入网站自己的登录态完成认证后,网站才能把这个userId用在企业业务接口里。originatorUserId = 当前扫码登录用户的 userId因此,扫码登录不是业务流程的终点,而是企业业务流程的身份入口。后续发起审批、查询审批状态、关联本地报销记录,都是建立在这个身份基础之上的。下篇我们分享怎么完成发起审批的。

2026-06-09 17:34:59 188

原创 什么是海勒姆定律(Hyrum‘s Law):当你的用户够多,连 Bug 都会变成「规格」

海勒姆定律的原文是这样说的:(当一个 API 拥有足够多的用户时,你在契约里承诺了什么并不重要:你系统所有可被观测到的行为,都会被某些人所依赖。正式文档(契约)说了不算,系统实际表现出来的任何蛛丝马迹才算。换句话说,你以为接口的「行为边界」是由你写的文档定义的,但实际上,真正定义边界的,是你的代码跑起来之后,用户能观察到的「一切现象」——包括返回顺序、运行速度、内存占用,甚至是那些你自己都没发现的 Bug。海勒姆定律本质上是在描述一种「权力的流失」。

2026-06-08 16:14:21 361 1

原创 为什么会有 `__pycache__`?——从一个目录,讲清楚python代码是怎么跑起来的

的做法是"边读边翻译边执行"。它不提前翻译整个程序,而是在运行时,一行一行(或一小块一小块)读取代码、当场翻译、当场执行。这时真正在你电脑上运行的程序其实是"解释器"本身,你的源代码只是喂给它的数据。编译能提前做大量分析和优化,生成的代码运行快、内存省,但启动慢、对动态特性不友好;解释启动快、灵活、能利用运行时信息做动态优化,但运行时要背负解释器自身的开销,通常更慢、更耗内存。明白了这把钥匙,我们就可以把几门有代表性的语言摆上地图,看看它们各自站在哪。理解这两种思路的差异,是看懂整张语言地图的钥匙。

2026-06-05 18:42:09 227

原创 从检测到跟踪:一篇带你建立目标跟踪认知的入门指南

回到开头的三个问题,现在你应该已经能清楚回答了:检测是无状态的空间任务,跟踪是带身份连续性的时空任务,二者通过 Tracking-by-Detection 范式衔接;CVAT 标注跟踪数据时,track ID、关键帧插值、occluded/outside 状态、以及导出格式是检测标注里见不到的关键点;而从 SORT 到 DeepSORT 再到 ByteTrack,主线是"如何把帧间目标关联得更准"——先用运动,再加外观,最后回过头来发现把检测信息用满才是性价比最高的路。

2026-06-01 11:57:44 226

原创 行为树(Behavior Tree):从 ROS 机器人到 Unity 游戏 AI 的统一决策范式

// 这里调用 ROS 2 的 Action Client,发送导航目标 ROS_INFO("Moving to: %s" , goal . c_str());// ... 省略实际导航调用 ... return NodeStatus :: SUCCESS;} };return 0;

2026-05-27 00:15:50 543

原创 Failed to initialize NVML: Driver/library version mismatch:一次驱动报错

先重启试试。

2026-05-22 14:12:57 498

原创 codex如何安装skill

实际上,把git链接给它,让它自己安装就好了😓。现在网上有很多skill,我们怎么安装呢。

2026-05-20 13:59:19 230

原创 奇异值分解(SVD):从几何直觉理解矩阵的本质

AUΣVTAUΣVTV:n×n 正交矩阵,列向量是右奇异向量vivi​Σ:对角矩阵,对角线上是奇异值U:m×m 正交矩阵,列向量是左奇异向量uiui​。

2026-05-18 18:34:52 498

原创 为什么 `sudo bash <(curl ...)` 会失败?谈谈 Bash 进程替换与 sudo 的边界问题

这个问题不是 Ubuntu 24.04 的 bug,也不是 curl 的 bug,更不是 AppArmor 或 Conda 干扰的。它是Bash 进程替换的语义和 sudo 的安全模型进程替换的/dev/fd/N只在创建它的进程里有效。sudo 跨越了进程边界,并刻意收紧了环境。所以官网给出的这种写法,在某些发行版/某些 sudo 配置下能跑(取决于 sudo 是否保留了 FD、/dev/fd/实现是否走的符号链接等细节),但它本质上是不可靠的。(看上去没有那么优雅但足够可靠)

2026-04-28 14:12:19 463

原创 用“医生看病“讲清楚贝叶斯定理

概率角色一句话理解先验 P(A)起点在没看到任何证据之前,我对真相的初始猜测似然 P(B|A)桥梁假设真相成立,证据出现的合理程度证据 P(B)标尺这个证据本身有多稀奇——越稀奇越有说服力后验 P(A|B)终点看到证据后,我对真相的最终判断。

2026-04-21 10:25:11 409

原创 从条件概率到最大似然:一篇讲透统计推断的核心思想

概念一句话理解条件概率在缩小的世界里重新算比例贝叶斯定理用新证据更新旧信念似然固定数据,评价"哪种规律最配"MLE选让数据最不奇怪的参数先验看到数据前你对参数的信念后验看到数据后你对参数的信念归一化常量让概率合法的"分母",找极值时可忽略。

2026-04-21 00:16:51 386

原创 如何下载huggingface数据

使用hf工具升级:用更简洁的hf替代旧版,命令更短更好记。镜像加速:通过让流量走国内镜像。断点续传:大数据集中途掉线不用怕,重复执行命令即可续传。掌握这套流程后,无论是下载数据集还是模型,你都能在国内网络环境下获得流畅、稳定的体验。祝你科研顺利!

2026-04-20 17:25:13 590

原创 关于打印:我或许应该知道些什么?

要说打印这事儿,还真得从咱们老祖宗说起。隋唐年间,中国人发明了雕版印刷。工匠们把一整页文字反刻在一块木板上,刷上墨,往纸上一压——得,一页书就出来了。这个思路,穿越一千多年,到今天的激光打印机里,本质上没变过。激光打印机的感光鼓就是那块"板",激光束就是那把"刻刀",碳粉就是那层"墨"。但雕版有个大问题——一块板只能印一页。你要印一本三百页的书,就得刻三百块板,费时费料。于是北宋年间,毕昇想出了活字印刷:把每个字单独做成一个小方块,要印什么页就把字排进框里,印完了拆开,下次换个内容重新排。

2026-04-13 21:57:22 482

原创 深入理解 Linux 打印体系:CUPS、驱动、ULD 与 Docker 容器化

把以上所有内容串起来,你需要记住的核心知识是这样的:打印的本质是格式转换。你的应用产生 PDF,打印机需要自己的"母语"(PostScript、PCL、SPL 等),CUPS 通过过滤器链完成这个转换。PPD 文件是这条链的"配方",它精确描述了打印机的能力和需要什么过滤器。专用驱动(如 ULD)提供了精确的 PPD 和正确的过滤器,所以排版精确。通用驱动使用通用的 PPD 和过滤器,对简单内容可以,对精确排版就不行。Docker 化的核心挑战是环境完整性。

2026-04-13 17:52:17 785

原创 配置ssh key失败?closed by remote host?

可以看到是连接的是 198.18.0.234,这个IP段通常是网络设备(如路由器、代理)使用的,所以这可能是22端口被限制,某些网络环境(公司、学校、运营商)会限制或屏蔽SSH默认的22端口。接下来就是指定连接github的时候使用443端口即可,我们把使用443端口配置到github的访问里。完成github的ssh key配置后,执行测试脚本时候,连接被远程关闭。443端口可以正常访问,那说明是网络的问题了。443是https的接口,一般不会被限制。所以我们看一下通过443端口是否可以,

2026-04-13 16:00:14 67

原创 解决codex在windows系统下的编码问题

2026-04-02 10:51:19 318

原创 Token、词元、分词?让我解开你的面具!词元到底是什么?一文彻底搞懂大模型的“最小思考单位“

词元(Token),是大语言模型处理文本的最小单位。AI 不认识"文字",它只认识"编号"。而词元就是文字在变成编号之前,被切分出来的那个"碎片"。要点一句话说明1词元是什么大模型处理信息的最小单位,不等于字,不等于词2词元怎么来的由分词器(Tokenizer)按照训练好的规则把文本切分而成3词元 ID 是什么每个词元在模型词表(词典)中的唯一编号,模型实际处理的就是这些 ID4为什么不按字/词切按字切太碎(丢语义),按词切太多(词表爆炸),子词是最佳折中5中文消耗更多 Token。

2026-03-27 14:58:48 640

原创 使用ollama部署functiongemma小试牛刀

听说functiongamma这个专门的工具调用模型还不错,我们今天在中文场景下试试水拉取最新ollama镜像试运行一下看上去呆呆傻傻的,我们写代码测试一下因为我的系统是部署在了192.168.10.60的11435端口上,所以大家用的时候,注意自行替换,vibecoding一下就行了结论整体感觉,如果不进行微调的话,不如qwen3-4B的模型,中文场景下,甚至推理时延也没有优势。或许更适合算力受限的场景?毕竟只有0.27B下面是一个LLM的综合评估结果,可供参考关键问题:FunctionG

2026-02-09 19:04:43 1082

原创 自定义模型训练踩坑日记:weights_only 与 AMP 的两个坑

在模型改进场景下,两件事要记住:一是 PyTorch 2.6+ 的默认行为会阻止加载包含自定义类的模型文件,需要显式关闭或声明白名单。二是自定义算子可能不支持 AMP 的 FP16 计算,导致训练启动阶段失败,需要用排除。这两个问题的报错信息都指向"文件损坏",但真正原因和文件本身无关。知道这一点,能省掉大量无效排查时间。

2026-02-04 17:24:25 498

原创 大模型部署与训练:如何选择显卡?

选择合适的显卡部署大模型是一个需要综合考量的决策。核心原则是:明确需求场景,理解硬件特性,计算真实成本。不要被单一参数(如显存大小或理论算力)误导,也不要忽视功耗、稳定性、扩展性等"软性"因素。A10适合推理但不适合训练,A100的40GB和80GB版本差异主要在带宽和容量而非算力,消费级显卡虽然性价比高但有功耗和稳定性隐患——理解这些细节,才能做出真正符合需求的选择。希望本文能帮助你在大模型部署和训练的硬件选型中少走弯路。如有具体场景需要讨论,欢迎进一步交流。

2026-02-03 20:08:40 904

原创 YOLOv3-tiny 网络结构浅析

Anchor(锚框)概念Anchor是预设的参考框,代表"常见目标的形状"原理:├── 统计训练集中所有目标框的宽高├── 用K-means聚类找出最常见的几种尺寸├── 这些尺寸就是anchor└── 网络预测的是相对于anchor的偏移量,而不是绝对尺寸好处:├── 网络只需要学习"微调",不需要从零预测尺寸├── 大幅降低学习难度└── 提高收敛速度和精度# 使用K-means为自己的数据集计算anchor"""

2026-02-03 14:48:54 577

原创 从两个水桶问题到广度优先搜索

想象你站在迷宫入口,想找到出口。深度优先(DFS):一条路走到黑,撞墙了再回头。广度优先(BFS):先探索所有相邻的格子,再探索相邻的相邻,一层一层向外扩散。BFS就像往平静的水面扔一颗石子,涟漪一圈一圈向外扩散。最先到达终点的路径,一定是最短路径。问题建模:将现实问题抽象为状态空间中的路径搜索算法选择:BFS保证找到最短路径实现细节:队列管理搜索顺序,集合避免重复访问数学洞察:裴蜀定理揭示了可解性的本质BFS的思想远不止于此。

2026-01-07 18:04:34 1231

原创 UTF-8 No!UTF-8-sig Yes!数据分析师为什么你应该用UTF-8-sig

BOM 的存在是历史的产物——它在 UTF-16 时代解决了真实的字节序问题。虽然在 UTF-8 的世界里它已经失去了原本的技术必要性,但由于 Windows 生态系统的广泛采用,它在跨平台协作中仍然扮演着重要角色。纯 Linux 工具链→ UTF-8(无 BOM)跨平台协作,尤其涉及 Windows/Excel记住:好的工程实践不是追求技术上的"正确",而是在约束条件下找到最能避免问题的解决方案。在跨平台文本处理这件事上,UTF-8-sig 就是那个务实的选择。

2026-01-06 17:22:01 850

原创 Git Push 失败?手把手教你配置 SSH Key,实现无痛推送代码

你是否还在为github无法执行git push而苦恼,就算输入了用户密码,仍然显示,将你打回原型,今天给大家分享一些基本操作,如何生成配置SSH key,让自己的服务器可以无痛推送代码。

2026-01-04 15:09:48 925

原创 linux指令批量解压 Tar 文件

现在我采集了一批数据,需要都解压,这需要处理多个.tar归档文件。逐个手动解压太不优雅了,

2025-12-30 15:58:01 410

原创 谁动了我的显卡?2个指令找出高显存占用的凶手!

今天开开心心跑着批量的训练任务,一看日志,OOM报错了,超出显存,查看显卡信息,发现存在高占用,但是我们怎么知道它的始作俑者是谁呢?今天我们来一起看一下。

2025-09-18 16:26:37 744

原创 Cusror无法连接到远程扩展主机服务器“failed to download file“, original: “No space left on device (os error 28)

这是当前运行的Cursor实例在/tmp目录中使用的socket路径,而其他的大都是/home目录下的,这不会影响到我们的/目录,所以实际上,我们解决掉这个/tmp文件的创建问题,就可以实现cursor的链接了!根目录下已经100%占用了,通过cursor连接服务器开发的时候,cursor会建立一个socket文件,在tmp目录下用于通信,所以,我们要做的就是把/tmp目录软链接出来。因为/tmp是一个系统目录,用来存放临时文件,在系统重启后,某些系统可能会重新创建/tmp目录,覆盖我们的软链接。

2025-09-15 20:30:38 554

原创 国内服务器如何安装docker或者是1panel

这里的安全入口注意一下,如果你设置默认的话,就是这么一个乱码一样的地址,你可以考虑设置一个更具有可读性和管理的路由地址。完全不用担心,1panel官方都给我们支好招了(前面的官方文档里就有提供无法安装docker的解决脚本,超级良心)插曲,我这里竟然遇到了要更新内核,难道你是虚拟机!那这里就先无脑回车吧(大佬可以讲讲这里我应该选什么服务)简单安装1panel,1panel非常好装。直接使用这里的地址和账户密码就可以访问啦!安装完毕后,再执行一下安装脚本。测试一下,是不是连接的问题。1.更新系统并安装依赖。

2025-09-01 19:49:28 840 1

原创 【Prompt集合】一个学习英文单词更好的提示词

以下是我个人使用的学习英文单词的提示词,有需要的同学自取。

2025-07-31 11:19:34 921 1

原创 苹果MAC M1安装pyaudio:解决symbol not found in flat namespace ‘_PaMacCore_SetupChannelMap‘问题

不同的平台安装方法不一样。对于苹果系统,需要先这样,再这样,就是安装portaudio和pyaudio。

2025-07-11 15:18:04 663 2

原创 容器化运行cosyvoice2服务

阿里语音实验室推出了跨语言克隆语音模型CosyVoice2,本文详细介绍了如何通过Docker部署该模型的完整流程。首先需要克隆项目代码并创建conda环境,然后下载模型权重文件。文中提供了优化后的Dockerfile,包含CUDA环境配置、系统依赖安装等步骤,避免了官方方案在容器中使用conda的不便。最后指导用户完成镜像构建和容器启动,成功运行后即可通过Web界面体验语音克隆功能。整个过程包含代码下载、环境配置、模型获取、镜像构建及服务启动等关键步骤。

2025-07-04 10:55:59 1995

原创 把大象塞进冰箱总共分几步:讲讲dockerfile里conda的移植

有时候为了容器化部署算法,经常我们需要打包我们的conda环境,我们可以看到不同的conda环境就是在不同的envs里,一个直觉就是直接拷贝走这整个目录。有时候这样是可以work的,但是有一个潜在的问题,比如你看我进入我的index-tts去查看我的pip指令可以看到shebang行这里写死了一个python解释器的绝对路径,而这样的库函数移植到容器里,是无论如何也找不到这个解释器的,所以就会报错。

2025-07-03 16:46:07 1191

原创 如何选择你的cuda镜像,CUDA和cuDNN?

首先我们先理解几个基础概念,GPU驱动,CUDA,和镜像。nvidia-smi输出中的和字段。。根据你的 GPU 型号查询对应的最新驱动。查看系统/容器是否安装了 CUDA Toolkit (及nvccnvcc -V如果命令执行成功并显示版本信息,则表示已安装。print(torch.version.cuda) # 显示 PyTorch 链接的 CUDA 运行时版本或。

2025-07-01 17:27:41 2070

原创 python里的abc库是什么东西

在深入探讨abcPython 的核心哲学之一。它不关心对象的具体类型,只关心它有没有某个方法或属性。比如,只要一个对象有quack()方法,我们就可以把它当作鸭子来处理。极度灵活,代码解耦度高,易于编写通用代码。运行时错误,如果在运行时某个“鸭子”缺少了它应该有的方法,程序就会崩溃。这在大型项目或多人协作时可能导致隐蔽的 bug。一个只有声明(方法签名),没有具体实现的方法。它规定了“应该做什么”,但“如何做”留给子类去完成。包含抽象方法的类。

2025-06-23 19:31:25 1230

原创 Matplotlib 库来可视化频谱泄漏和加窗的效果

很多朋友学习音频技术的时候,不理解这个频谱泄漏是什么,我们这次写个小代码直观地感受一下。

2025-06-05 19:06:26 540

原创 欧拉公式简明推导

欧拉公式ejθcosθjsinθ被誉为“数学中最美丽的公式”之一,我们利用入门的高数知识来简单证明它

2025-06-05 17:30:27 3331

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除