自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(143)
  • 收藏
  • 关注

原创 关于打印:我或许应该知道些什么?

要说打印这事儿,还真得从咱们老祖宗说起。隋唐年间,中国人发明了雕版印刷。工匠们把一整页文字反刻在一块木板上,刷上墨,往纸上一压——得,一页书就出来了。这个思路,穿越一千多年,到今天的激光打印机里,本质上没变过。激光打印机的感光鼓就是那块"板",激光束就是那把"刻刀",碳粉就是那层"墨"。但雕版有个大问题——一块板只能印一页。你要印一本三百页的书,就得刻三百块板,费时费料。于是北宋年间,毕昇想出了活字印刷:把每个字单独做成一个小方块,要印什么页就把字排进框里,印完了拆开,下次换个内容重新排。

2026-04-13 21:57:22 95

原创 深入理解 Linux 打印体系:CUPS、驱动、ULD 与 Docker 容器化

把以上所有内容串起来,你需要记住的核心知识是这样的:打印的本质是格式转换。你的应用产生 PDF,打印机需要自己的"母语"(PostScript、PCL、SPL 等),CUPS 通过过滤器链完成这个转换。PPD 文件是这条链的"配方",它精确描述了打印机的能力和需要什么过滤器。专用驱动(如 ULD)提供了精确的 PPD 和正确的过滤器,所以排版精确。通用驱动使用通用的 PPD 和过滤器,对简单内容可以,对精确排版就不行。Docker 化的核心挑战是环境完整性。

2026-04-13 17:52:17 92

原创 配置ssh key失败?closed by remote host?

可以看到是连接的是 198.18.0.234,这个IP段通常是网络设备(如路由器、代理)使用的,所以这可能是22端口被限制,某些网络环境(公司、学校、运营商)会限制或屏蔽SSH默认的22端口。接下来就是指定连接github的时候使用443端口即可,我们把使用443端口配置到github的访问里。完成github的ssh key配置后,执行测试脚本时候,连接被远程关闭。443端口可以正常访问,那说明是网络的问题了。443是https的接口,一般不会被限制。所以我们看一下通过443端口是否可以,

2026-04-13 16:00:14 7

原创 解决codex在windows系统下的编码问题

2026-04-02 10:51:19 221

原创 Token、词元、分词?让我解开你的面具!词元到底是什么?一文彻底搞懂大模型的“最小思考单位“

词元(Token),是大语言模型处理文本的最小单位。AI 不认识"文字",它只认识"编号"。而词元就是文字在变成编号之前,被切分出来的那个"碎片"。要点一句话说明1词元是什么大模型处理信息的最小单位,不等于字,不等于词2词元怎么来的由分词器(Tokenizer)按照训练好的规则把文本切分而成3词元 ID 是什么每个词元在模型词表(词典)中的唯一编号,模型实际处理的就是这些 ID4为什么不按字/词切按字切太碎(丢语义),按词切太多(词表爆炸),子词是最佳折中5中文消耗更多 Token。

2026-03-27 14:58:48 401

原创 使用ollama部署functiongemma小试牛刀

听说functiongamma这个专门的工具调用模型还不错,我们今天在中文场景下试试水拉取最新ollama镜像试运行一下看上去呆呆傻傻的,我们写代码测试一下因为我的系统是部署在了192.168.10.60的11435端口上,所以大家用的时候,注意自行替换,vibecoding一下就行了结论整体感觉,如果不进行微调的话,不如qwen3-4B的模型,中文场景下,甚至推理时延也没有优势。或许更适合算力受限的场景?毕竟只有0.27B下面是一个LLM的综合评估结果,可供参考关键问题:FunctionG

2026-02-09 19:04:43 1043

原创 自定义模型训练踩坑日记:weights_only 与 AMP 的两个坑

在模型改进场景下,两件事要记住:一是 PyTorch 2.6+ 的默认行为会阻止加载包含自定义类的模型文件,需要显式关闭或声明白名单。二是自定义算子可能不支持 AMP 的 FP16 计算,导致训练启动阶段失败,需要用排除。这两个问题的报错信息都指向"文件损坏",但真正原因和文件本身无关。知道这一点,能省掉大量无效排查时间。

2026-02-04 17:24:25 410

原创 大模型部署与训练:如何选择显卡?

选择合适的显卡部署大模型是一个需要综合考量的决策。核心原则是:明确需求场景,理解硬件特性,计算真实成本。不要被单一参数(如显存大小或理论算力)误导,也不要忽视功耗、稳定性、扩展性等"软性"因素。A10适合推理但不适合训练,A100的40GB和80GB版本差异主要在带宽和容量而非算力,消费级显卡虽然性价比高但有功耗和稳定性隐患——理解这些细节,才能做出真正符合需求的选择。希望本文能帮助你在大模型部署和训练的硬件选型中少走弯路。如有具体场景需要讨论,欢迎进一步交流。

2026-02-03 20:08:40 719

原创 YOLOv3-tiny 网络结构浅析

Anchor(锚框)概念Anchor是预设的参考框,代表"常见目标的形状"原理:├── 统计训练集中所有目标框的宽高├── 用K-means聚类找出最常见的几种尺寸├── 这些尺寸就是anchor└── 网络预测的是相对于anchor的偏移量,而不是绝对尺寸好处:├── 网络只需要学习"微调",不需要从零预测尺寸├── 大幅降低学习难度└── 提高收敛速度和精度# 使用K-means为自己的数据集计算anchor"""

2026-02-03 14:48:54 449

原创 从两个水桶问题到广度优先搜索

想象你站在迷宫入口,想找到出口。深度优先(DFS):一条路走到黑,撞墙了再回头。广度优先(BFS):先探索所有相邻的格子,再探索相邻的相邻,一层一层向外扩散。BFS就像往平静的水面扔一颗石子,涟漪一圈一圈向外扩散。最先到达终点的路径,一定是最短路径。问题建模:将现实问题抽象为状态空间中的路径搜索算法选择:BFS保证找到最短路径实现细节:队列管理搜索顺序,集合避免重复访问数学洞察:裴蜀定理揭示了可解性的本质BFS的思想远不止于此。

2026-01-07 18:04:34 1110

原创 UTF-8 No!UTF-8-sig Yes!数据分析师为什么你应该用UTF-8-sig

BOM 的存在是历史的产物——它在 UTF-16 时代解决了真实的字节序问题。虽然在 UTF-8 的世界里它已经失去了原本的技术必要性,但由于 Windows 生态系统的广泛采用,它在跨平台协作中仍然扮演着重要角色。纯 Linux 工具链→ UTF-8(无 BOM)跨平台协作,尤其涉及 Windows/Excel记住:好的工程实践不是追求技术上的"正确",而是在约束条件下找到最能避免问题的解决方案。在跨平台文本处理这件事上,UTF-8-sig 就是那个务实的选择。

2026-01-06 17:22:01 810

原创 Git Push 失败?手把手教你配置 SSH Key,实现无痛推送代码

你是否还在为github无法执行git push而苦恼,就算输入了用户密码,仍然显示,将你打回原型,今天给大家分享一些基本操作,如何生成配置SSH key,让自己的服务器可以无痛推送代码。

2026-01-04 15:09:48 868

原创 linux指令批量解压 Tar 文件

现在我采集了一批数据,需要都解压,这需要处理多个.tar归档文件。逐个手动解压太不优雅了,

2025-12-30 15:58:01 384

原创 谁动了我的显卡?2个指令找出高显存占用的凶手!

今天开开心心跑着批量的训练任务,一看日志,OOM报错了,超出显存,查看显卡信息,发现存在高占用,但是我们怎么知道它的始作俑者是谁呢?今天我们来一起看一下。

2025-09-18 16:26:37 634

原创 Cusror无法连接到远程扩展主机服务器“failed to download file“, original: “No space left on device (os error 28)

这是当前运行的Cursor实例在/tmp目录中使用的socket路径,而其他的大都是/home目录下的,这不会影响到我们的/目录,所以实际上,我们解决掉这个/tmp文件的创建问题,就可以实现cursor的链接了!根目录下已经100%占用了,通过cursor连接服务器开发的时候,cursor会建立一个socket文件,在tmp目录下用于通信,所以,我们要做的就是把/tmp目录软链接出来。因为/tmp是一个系统目录,用来存放临时文件,在系统重启后,某些系统可能会重新创建/tmp目录,覆盖我们的软链接。

2025-09-15 20:30:38 537

原创 国内服务器如何安装docker或者是1panel

这里的安全入口注意一下,如果你设置默认的话,就是这么一个乱码一样的地址,你可以考虑设置一个更具有可读性和管理的路由地址。完全不用担心,1panel官方都给我们支好招了(前面的官方文档里就有提供无法安装docker的解决脚本,超级良心)插曲,我这里竟然遇到了要更新内核,难道你是虚拟机!那这里就先无脑回车吧(大佬可以讲讲这里我应该选什么服务)简单安装1panel,1panel非常好装。直接使用这里的地址和账户密码就可以访问啦!安装完毕后,再执行一下安装脚本。测试一下,是不是连接的问题。1.更新系统并安装依赖。

2025-09-01 19:49:28 791 1

原创 【Prompt集合】一个学习英文单词更好的提示词

以下是我个人使用的学习英文单词的提示词,有需要的同学自取。

2025-07-31 11:19:34 855 1

原创 苹果MAC M1安装pyaudio:解决symbol not found in flat namespace ‘_PaMacCore_SetupChannelMap‘问题

不同的平台安装方法不一样。对于苹果系统,需要先这样,再这样,就是安装portaudio和pyaudio。

2025-07-11 15:18:04 624 2

原创 容器化运行cosyvoice2服务

阿里语音实验室推出了跨语言克隆语音模型CosyVoice2,本文详细介绍了如何通过Docker部署该模型的完整流程。首先需要克隆项目代码并创建conda环境,然后下载模型权重文件。文中提供了优化后的Dockerfile,包含CUDA环境配置、系统依赖安装等步骤,避免了官方方案在容器中使用conda的不便。最后指导用户完成镜像构建和容器启动,成功运行后即可通过Web界面体验语音克隆功能。整个过程包含代码下载、环境配置、模型获取、镜像构建及服务启动等关键步骤。

2025-07-04 10:55:59 1878

原创 把大象塞进冰箱总共分几步:讲讲dockerfile里conda的移植

有时候为了容器化部署算法,经常我们需要打包我们的conda环境,我们可以看到不同的conda环境就是在不同的envs里,一个直觉就是直接拷贝走这整个目录。有时候这样是可以work的,但是有一个潜在的问题,比如你看我进入我的index-tts去查看我的pip指令可以看到shebang行这里写死了一个python解释器的绝对路径,而这样的库函数移植到容器里,是无论如何也找不到这个解释器的,所以就会报错。

2025-07-03 16:46:07 1155

原创 如何选择你的cuda镜像,CUDA和cuDNN?

首先我们先理解几个基础概念,GPU驱动,CUDA,和镜像。nvidia-smi输出中的和字段。。根据你的 GPU 型号查询对应的最新驱动。查看系统/容器是否安装了 CUDA Toolkit (及nvccnvcc -V如果命令执行成功并显示版本信息,则表示已安装。print(torch.version.cuda) # 显示 PyTorch 链接的 CUDA 运行时版本或。

2025-07-01 17:27:41 1955

原创 python里的abc库是什么东西

在深入探讨abcPython 的核心哲学之一。它不关心对象的具体类型,只关心它有没有某个方法或属性。比如,只要一个对象有quack()方法,我们就可以把它当作鸭子来处理。极度灵活,代码解耦度高,易于编写通用代码。运行时错误,如果在运行时某个“鸭子”缺少了它应该有的方法,程序就会崩溃。这在大型项目或多人协作时可能导致隐蔽的 bug。一个只有声明(方法签名),没有具体实现的方法。它规定了“应该做什么”,但“如何做”留给子类去完成。包含抽象方法的类。

2025-06-23 19:31:25 1195

原创 Matplotlib 库来可视化频谱泄漏和加窗的效果

很多朋友学习音频技术的时候,不理解这个频谱泄漏是什么,我们这次写个小代码直观地感受一下。

2025-06-05 19:06:26 520

原创 欧拉公式简明推导

欧拉公式ejθcosθjsinθ被誉为“数学中最美丽的公式”之一,我们利用入门的高数知识来简单证明它

2025-06-05 17:30:27 3073

原创 为什么我们打开一个音频文件,看到的dB是负数

音频信号的正负值记录了声波的振动方向,其幅度则反映了强度。由于数字系统存在最大可表示的“天花板”(Full Scale),以及不同音频设备所能表现的绝对音量差异,所以音频文件使用 dBFS作为音量的指标。核心要点:记录声波的瞬时方向(密部或疏部)与强度。数字音频系统的绝对上限,任何超过 0 dBFS 的信号都会导致削波失真。表示信号电平低于系统最大容量,负数值越大(如 -20 dBFS 比 -6 dBFS 更大),表示信号越弱。dBFS 是数字音频的“罗盘”,用于防止削波、标准化电平、优化信噪比。

2025-06-05 10:07:39 2341

原创 奈氏准则/奈奎斯特定理 如何直观理解2W这个超参数,为什么偏偏就是2呢?

核心原因就在于信号的周期性变化。一个频率为。

2025-06-04 18:54:04 1118

原创 极客时间-《搞定音频技术》-学习笔记

声音的三要素是指响度、音调和音色,它们都是声音的主观属性,用来描述声音的特征。响度指声音的强弱,音调指声音的高低,音色指声音的质量或特征。响度(Loudness):指声音的强弱,由振幅决定。振幅越大,响度越大;振幅越小,响度越小。响度还跟距离发声体远近有关。单位是分贝(dB)。音调(Pitch):指声音的高低,由频率决定。频率越高,音调越高;频率越低,音调越低。单位是赫兹(Hz)。人耳能听到的频率范围大约是20Hz 到20000Hz。

2025-06-04 16:58:57 1376

原创 Pydub 库初探:轻松玩转 Python 音频处理,告别“望声生畏”

Pydub 是一个强大且易用的 Python 音频处理库,它通过简洁的 API 封装了复杂的底层操作。是核心:所有操作围绕这个不可变对象进行。FFmpeg/Libav 是强大后盾:处理 WAV/RAW 以外的大多数格式依赖它们。务必正确安装。易用性优先:Pythonic 的接口,链式操作,参数自动匹配。常用操作覆盖全面:加载、导出、剪辑、拼接、音量调整、淡入淡出、叠加、格式转换等一应俱全。适用于快速开发和常见任务:是音频处理入门和完成日常任务的绝佳选择。

2025-06-03 16:07:33 1735

原创 【西方哲学-0】西哲思维导图mermaid格式

以下是个人学习西哲的一个简易思维导图。

2025-05-28 18:01:31 432

原创 为什么dockerfile中你不应该写entrypoint

ENTRYPOINTCMD优先:大多数应用,将启动逻辑放CMD。ENTRYPOINT用于固定逻辑:需要不变的初始化或包装脚本时使用。ENTRYPOINT脚本使用exec "$@":确保信号传递和CMD参数正确执行。JSON格式ENTRYPOINT和CMD优先用JSON数组格式。尊重基础镜像ENTRYPOINT:尤其对NVIDIA等专用镜像,不要轻易覆盖。深刻理解ENTRYPOINT和CMD。

2025-05-27 17:29:51 917

原创 每天一条小指令:什么是chmod 1777

chmod 1777命令不仅仅是将目录权限设置为“人人可读写执行”,更重要的是通过首位的1启用了粘滞位。这个小小的t标记,在多用户共享的目录(如/tmp)中扮演着至关重要的角色,它确保了用户文件的安全,防止被其他普通用户删除或篡改,从而维护了系统的稳定性和安全性。理解并正确使用这一权限设置,是 Linux 系统管理中的一个重要知识点。

2025-05-27 10:39:42 1009

原创 【文章速读】Tim Ferriss《每周工作4小时》

章节标题与迷思破解很多人看到"新贵"(New Rich)这个词,会误以为这是另一本教你如何暴富的书。实际上,费里斯定义的"新贵"不是指拥有巨额财富的人,而是指那些掌控时间和移动性的人。核心概念详解新贵(NR)vs 传统富人:传统富人追求积累财富,推迟享受;新贵追求现金流和时间自由,活在当下相对收入:年收入10万美元工作50周 vs 年收入5万美元工作10周,后者的相对收入更高迷你退休:不是等到65岁才退休,而是将退休分散到整个人生中具体案例剖析。

2025-05-26 14:30:20 1504

原创 如何不规范的设置密码

当我们使用服务器的时候,有时候需要一些非常简单的密码,来方便使用,但是自己完全可控的环境下,我们希望我们的密码足够的简单,比如,可能它的密码就是123,或者是1?但是当你直接使用passwd的时候,会受到PAM配置的限制,所以我们用点奇淫技巧,比如我们把mark的密码设置为1这样就可以了,将上面替换mark和1为你的username和密码即可echo。

2025-05-26 09:20:53 800

原创 一个指令查询你服务器所在的公网IP

如果你还有更简单的指令,请教会我!!!对于日常网络管理、服务器运维和网络故障排查,这种方法无疑是传统网站查询的最佳替代方案。

2025-05-15 11:39:47 678

原创 Linux服务器硬盘挂载小记录

单位给给了台老设备用,存储非常有限,精叫唤后领导加了个硬盘。本文将分享一个实际案例,详细介绍如何在Linux服务器上识别、格式化并挂载硬盘,特别是如何从Windows兼容的NTFS格式转换为Linux原生的ext4文件系统,以获得更好的性能和管理体验。

2025-05-14 15:56:25 1297 1

原创 【效率提升】Vibe Coding时代如何正确使用输入法:自定义短语实现Prompt快捷输入

搜狗拼音输入法的自定义短语功能可能是许多人早已忽略的强大工具。它不仅可以用来输入常用语,更可以成为管理和快速调用AI prompt的绝佳解决方案。在AI工具日益普及的今天,高效的prompt管理和输入方式已成为提升工作效率的关键因素。搜狗拼音输入法的自定义短语功能为我们提供了一种优雅、高效的解决方案,让我们能够专注于与AI的交互本身,而不是在复制粘贴的琐事上浪费时间。无论你是AI写作爱好者、程序员还是数据分析师,这个简单的工具技巧都能为你节省大量时间,提升工作体验。

2025-04-30 14:28:49 1342

原创 Docker 基础镜像的“最佳”空闲指令:为什么推荐 `CMD [“sleep“, “infinity“]`?

最近笔者在做ocr的相关工作,在这个地址看到一个dockerfile的构建指令这个dockerfile最后写了这么一行指令,想到很多同学可能对保活指令还不够熟悉,由此和大家分享一下。done;"]在使用 Docker 时,我们经常会构建自己的镜像,或者基于现有的镜像进行扩展。一个常见的场景是创建一个“基础”镜像,这个镜像可能包含了我们需要的操作系统环境、依赖库、配置文件等,但它本身并不运行一个特定的应用程序。它更像是一个模板,后续的应用镜像会基于它来构建。

2025-04-29 17:31:13 1549

原创 告别配置之痛——为什么 TOML 是更现代的选择?

TOML 并非旨在取代 JSON 或 YAML,而是为特定的痛点——创建易于人类理解和维护的配置文件——提供了优雅的解决方案。它在 INI 的简洁性、JSON 的结构化和 YAML 的部分人类友好性之间取得了良好的平衡,同时避免了后两者的主要缺点。是一个有争议的设计决策(有人认为“键不存在”即是 null,有人则需要显式 null),其嵌套表示方式也有不同的看法。这是 TOML 最受推崇的优点。对比 JSON,TOML 省略了大量的引号和结尾逗号,顶层结构也无需花括号包裹,使得手动编辑更加流畅,错误更少。

2025-04-23 14:47:21 2679

原创 yaml里的挪威问题是啥

这个问题得名于挪威地名中经常包含冒号的特点,例如当你想在YAML中表示"Oslo: Norway"(奥斯陆:挪威)这样的键值对时,由于冒号在YAML中是键值分隔符,如果不正确处理,解析器会错误地将冒号后的内容解释为新的值,而不是字符串的一部分。在YAML中的"挪威问题"通常指的是YAML解析器对于特殊字符(尤其是冒号)的处理问题,特别是在解析包含冒号的字符串时可能出现的歧义。这个问题是YAML语法中的一个著名陷阱,经常出现在配置文件中,尤其是当配置值包含URL、时间戳或其他自然包含冒号的字符串时。

2025-04-22 19:27:18 345

原创 火山引擎实时语音合成WebSocket V3协议Python实现demo

火山引擎(字节跳动旗下)的语音合成产品确实非常面向多媒体内容创作,特别是短视频、有声书和多人场景。火山引擎提供了极其丰富的音色选择(100+音色),并按以下场景精细分类:多情感音色:支持情感变化,适合短视频叙事通用场景:基础音色趣味口音:各地方言口音,非常适合短视频创意内容角色扮演:大量角色化音色(40+种),明显针对剧情类短视频、对白场景视频配音:专为视频内容优化的音色有声阅读:针对长文本朗读的优化音色丰富的角色音色:如"奶气萌娃"、“病弱少女”、"傲娇霸总"等,这些音色非常适合抖音等平台上的角

2025-04-22 16:44:09 3656

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除