- 博客(103)
- 收藏
- 关注
原创 清理docker残留镜像images
核心原因:镜像被已停止的容器引用,Docker 阻止了普通删除操作。推荐操作:先执行删除关联容器,再执行删除镜像。注意事项:强制删除(-f)仅作为备选,优先选择 “删容器→删镜像” 的顺序,避免破坏有用的容器。
2026-02-08 22:25:15
689
原创 模态框和传统html新页面的优劣分析
模态框的核心优势是交互流畅、上下文保留,适合轻量、临时、无需分享的短操作;缺点是 URL 无同步、可访问性需额外处理,不适合复杂场景。传统新页面的核心优势是结构清晰、支持 URL / 导航,适合核心功能、复杂内容、需分享的场景;缺点是上下文丢失、性能损耗,不适合轻量临时操作。实际开发中可结合使用(如列表页用模态框预览简单信息,点击 “查看完整详情” 跳转新页面),兼顾体验与实用性。
2026-02-07 22:21:53
584
原创 Rerank模型简介二——耗时问题
Rerank 模型不替代向量相似度,而是对向量检索后的候选结果做精细化重排,二者是 “粗筛 + 精排” 的协作关系;Rerank 并非 “非常耗时”:仅处理少量候选数据,新增耗时可控(百毫秒级),且可通过选轻量模型、控制候选数进一步优化;核心价值:以少量耗时成本,大幅提升检索结果的语义匹配精度,是 RAG 等场景中 “性价比极高” 的优化手段。
2026-01-31 14:15:40
533
原创 Rerank模型简介
Rerank 模型(重排序模型)是检索 + 排序流程中的后序优化模型,核心作用是对初步检索出的候选结果做精细化打分、重新排序,让与查询意图最匹配的结果排在最前,解决初步检索(如关键词检索、向量检索)精度不足、排序粗糙的问题。简单说:初步检索负责「从海量数据里快速捞取相关候选(比如 100 个)」,Rerank 模型负责「对这 100 个候选做精准筛选排序,挑出 Top10 最贴合的」,是 **“粗筛 + 精排”** 检索架构的核心组件。
2026-01-31 13:53:55
609
原创 虚拟机VM调用物理机GPU相关问题
虚拟机中部署 AI 大模型问答系统,核心取决于和,主流的实现方式是和,前者性能损耗极低,是大模型部署的首选,后者适合多虚拟机轻量共享 GPU 资源。,但通过专门的虚拟化配置,能让虚拟机直接 / 间接使用物理机的 GPU 算力,满足大模型的推理 / 训练需求。
2026-01-31 09:52:41
699
原创 嵌入模型和大语言模型的关系
直接回答用户问题(如「解释一下 RAG 的原理」);总结长文本(如把你的知识库内容总结成核心要点);多轮对话(如「基于这个知识点,再举个例子」)。核心区别:嵌入模型(MiniLM/bert/nomic)= 文本→向量(检索),无推理;LLM(qwen:1.5b/deepseek-r1)= 文本→文本(推理 / 生成);协作逻辑:RAG 场景中,嵌入模型负责「找相关文本」,LLM 负责「用这些文本推理回答」;
2026-01-26 08:50:10
845
原创 文本嵌入模型的比较(三)
核心原因:嵌入函数决定向量的维度、语义空间、数值分布,更新函数后旧向量在新空间中无意义,检索失效;实操关键:无需重建 chromadb 客户端,只需新建集合 + 重新导入文本(用新函数生成新向量);本质逻辑:向量数据库的「检索准确性」依赖「嵌入函数和向量的一一对应」,这是所有向量数据库(chromadb/pinecone/milvus)的通用规则。
2026-01-26 01:11:33
387
原创 文本嵌入模型的比较(二)
核心定位是 chromadb 推出的「速度 + 精度平衡」的新一代默认嵌入模型,支持中文但依赖 onnxruntime;对比结论:精度>ONNXMiniLM_L6_V2,速度>bert-base-chinese,中文适配性≈bert-base-chinese;建议:继续使用更稳妥(无 onnxruntime 依赖,中文生态成熟),除非有长文本 / 多语言 / 速度优化的明确需求。简单说,是「折中方案」,但对纯中文知识库项目,仍是更适配、更稳定的选择。
2026-01-26 01:03:18
579
原创 文本嵌入模型的比较(一)
核心差异:ONNXMiniLM_L6_V2 胜在「快、轻、原生」,bert-base-chinese 胜在「中文准、信息全、适配广」;选型结论:中文知识库项目优先用 bert-base-chinese(代码改造量小,精度收益大);落地建议:按之前给的代码替换 chromadb 嵌入函数,无需装 onnxruntime,直接复用已安装的 sentence-transformers 即可。简单说,牺牲一点速度换中文检索的精准度,对项目是更优选择;
2026-01-26 00:56:21
644
原创 Windows 系统中通过 Conda 「克隆」环境
如果想把新环境复制到非默认路径(比如 D 盘,避免 C 盘占用),用--prefix# 格式:conda create --prefix 新环境路径 --clone 原环境名 -y# 示例:把 "zhishiku" 克隆到 D 盘的 conda_envs 目录下,新环境名(路径)为 D:\conda_envs\zhishiku_copy。conda create -n 新环境名 --clone 原环境名 -y(默认路径克隆);
2026-01-25 15:44:34
447
原创 ubuntu中虚拟环境的简单创建和管理
python3 -m venv 环境名;source 环境名/bin/activate;deactivate。管理就记住 2 个操作:激活后用装包,删环境直接删文件夹。
2026-01-22 12:30:07
363
原创 虚拟环境隔离安装senten-transformer
应用代码(main.py 等)无需任何修改,虚拟环境不影响代码逻辑;关键操作:运行代码前必须激活虚拟环境,或在启动命令中指定虚拟环境内的 Python 解释器路径;特殊场景:若用后台服务(Supervisor/Gunicorn)运行,只需修改启动命令的路径,无需改代码。按这个方式操作,就能让代码正常使用虚拟环境中的依赖,且完全保留原有业务逻辑。
2026-01-22 12:15:46
429
原创 虚拟机ubuntu中磁盘满了 + 镜像损坏,如何解决
如果强迫症想装原生 Docker,执行下面的命令一键安装(Ubuntu/Debian 通用),安装后 Podman 的软链接会被覆盖,执行完后注销重新登录,即可免 sudo 执行 docker 命令。,连执行删除命令的临时空间都没有,所以删镜像也报错,优先级:先。可选:安装原生 Docker(如果想彻底替换 Podman)目标:磁盘空间释放、坏镜像删掉、容器正常启动。清空间 → 再删垃圾 → 最后操作容器镜像。Podman 与 Docker 的无缝切换。验证是否全部恢复正常。
2026-01-19 21:13:07
335
原创 读懂gunicorn基本配置
这条命令的完整解读是:调用这个 Python 虚拟环境中的 Gunicorn 服务器,启动时加载目录下的配置文件,然后从当前工作目录的app.py模块中读取app这个 Web 应用实例,最终以 WSGI 协议运行该 Python Web 应用。
2026-01-19 14:47:53
335
原创 python 在windows如何开启webserver
快速启动静态服务器:用python -m http.server [端口](Python 3),适合临时共享文件 / 测试静态页面。动态内容 / 开发:推荐用 Flask 框架,需先安装,编写简单代码即可启动。核心要点:启动前切换到目标目录、注意端口占用、停止用Ctrl + C。
2026-01-18 10:25:19
792
原创 ubuntu18可以直接升级到22版本吗
不能直接升级到 22.04,必须通过 20.04 作为中间版本分步升级。升级前务必备份数据、更新当前系统、关闭第三方 PPA,这是避免失败的核心。生产环境优先选择重新部署而非升级,更稳定且可控。
2026-01-06 17:36:36
414
原创 Docker GPG 密钥下载失败如何处理
则是问题,核心原因是网络连接 / SSL 握手异常(Ubuntu 18.04 自带的 OpenSSL 版本较旧,或网络访问受限)。
2026-01-06 12:42:51
189
原创 iTunes Lookup API 规则具体(查包名)
查包名用bundleId参数,查数字 Apple ID 用id参数,别混用;仅能查上架 App,未上架测试包返回空;仅返回公开信息,隐私数据(如开发者真实身份)查不到;按频率限制调用,避免 IP 封禁。
2025-12-30 22:10:16
747
原创 通俗讲解苹果ios购买沙盒环境作用和搭建流程
沙盒环境的价值最简搭建关键1. 不花真实钱;2. 模拟真实购买流程;3. 验证代码逻辑是否正常1. 建沙盒测试账号;2. 手机用沙盒账号买;3. 服务端指定沙盒环境验证沙盒环境让你用「假账号、假支付、假收据」,测通「真代码、真流程」,上线后换成生产环境即可。那如果在生产环境中开启了沙盒模式,是不是就用假账号、假支付、假收据购买了真商品?哪怕不小心把生产环境的代码写成了真实用户的生产收据传到沙盒接口 → 返回 21008 错误 → 验证失败 → 不会发货 / 扣费;
2025-12-30 21:21:31
759
原创 如何在沙盒环境中进行内购测试
沙盒内购测试的核心是「专用测试账号 + 沙盒接口验证 + 全流程覆盖」:先创建沙盒测试账号,配置设备和 App,客户端触发沙盒支付,服务端验证沙盒收据,最后测试关键场景。确保每一步的环境(沙盒 / 生产)匹配,避免 21007/21008 等验证错误。
2025-12-30 20:44:15
1231
原创 什么是苹果官方提供的沙盒环境
沙盒环境就是 iOS 内购的「测试专用环境」,核心价值是无真实资金交易、独立测试、适配苹果审核。在代码中必须区分沙盒 / 生产环境,否则会导致收据验证失败(21007/21008 错误)。
2025-12-30 20:37:18
295
原创 iOS 内购收据验证的基础实现
该代码是 iOS 内购验证的核心逻辑,优化后增加了异常处理、自动环境切换、结果解析、日志记录等生产级特性,可直接集成到业务系统中。区分沙盒 / 生产环境;校验防止重复发货;解析状态码并处理异常;订阅类商品需传递共享密钥。
2025-12-30 20:33:20
473
原创 多提问题能否增强模型回答准确度
单纯 “多提问题” 没用,关键是 “提高质量问题 + 记录反馈 + 针对性优化”;优先优化 “检索 + Prompt + 文件解析”(低成本、见效快),再考虑模型微调(高成本、长期收益);核心指标:用 “准确率”(正确回答的问题数 / 总问题数)衡量优化效果,目标是逐步提升到 80% 以上。按这个逻辑,你的项目会从 “能运行” 逐步迭代到 “好用、准确”,且每一步都有明确的问题导向,不会盲目优化。
2025-11-24 17:31:30
841
原创 图文并茂的笔记、便签是如何用py开发的
新手想快速实现:选「Python + Flask + Editor.md + PyInstaller」,1-2 天就能做出可用的图文笔记工具;追求原生桌面体验:选「Electron + Python」,适合想做类似 Obsidian 的专业工具;坚持纯 Python:仅适合简单需求,或需深度集成系统功能的场景,否则不推荐。核心思路是「不重复造轮子」—— 用现成的富文本编辑器解决图文排版问题,用 Python 解决本地存储和跨平台打包,高效落地需求。
2025-11-24 16:09:42
755
原创 批量保存浏览器 Network 中请求
chrome-har-capturer` 或 `har-export` 把 HAR 里每个 URL 重新拉取一遍;------------------------------------------------- “整站静态备份,无登录无 JS 动态”→ wget --mirror --span-hosts --convert-links 一条命令解决。--page-requisites 拉取 JS/CSS/图片等“渲染必需品”--convert-links 把外链改成相对路径,离线可点。
2025-11-17 16:58:25
598
原创 LangChain的基础概念
LangChain 是一个用于构建基于大语言模型(LLM)的应用程序的开源框架,核心目标是,让开发者能更高效地构建复杂的 LLM 应用(如问答系统、聊天机器人、RAG 等)。
2025-11-14 11:07:14
190
原创 sentence-transformers和transformers是什么关系
是「基础工具」,覆盖全场景,灵活性高但需手动处理细节。是「专项工具」,基于前者优化,专注句子嵌入,开箱即用。如果任务是生成句子向量,优先用;若需更灵活的模型控制或其他 NLP 任务,直接用。
2025-11-14 11:05:40
279
原创 OpenMP 冲突问题:从易到难解析 + 最简解决方案
先看场景:如果是 “求和、计数、求最值”→ 直接用reduction(最简单,零手动同步);再看变量:如果变量不需要共享→ 用private(从根源避免冲突);最后用critical:如果是复杂场景(写文件、修改数据结构)→ 用critical保护临界区。按这个顺序,能解决 90% 的 OpenMP 冲突问题,且操作最简单,新手无需理解复杂的线程同步原理就能上手。OpenMP 冲突问题和 GPU 环境没有必然关联。
2025-11-14 10:14:54
1109
原创 python的tkinter界面美化之ttkbootstrap 主题类别
深色主题,以深蓝、黑色为主,搭配鲜明的红色 / 黄色点缀,风格硬朗、有科技感,类似 “超级英雄” 主题的视觉冲击。高对比度深色主题,以深灰为背景,搭配明亮的黄色、橙色控件,视觉上有 “日光” 般的冲击力,适合强调重点内容的界面。科技感深色主题,以黑、深灰为主,搭配冷色调(如浅蓝)控件,风格冷峻、未来感强,适合科技类、工具类应用。现代、简洁的浅色主题,配色清新明快,以浅灰、白色为基调,控件边缘圆润,适合追求简约现代感的界面。冷色调浅色主题,以浅蓝、白色为主,风格冷静清爽,控件细节精致,适合专业工具类界面。
2025-11-13 12:14:09
405
原创 auto-py-to-exe工具的使用方法
等),通过界面中的选项卡(如「基础设置」「附加文件」「图标」)即可完成配置,适合不熟悉命令行的新手。添加后,工具会自动处理这些文件的打包路径(保持原相对路径结构),确保程序运行时能正确读取。的使用,让用户无需记忆复杂的命令行参数,即可完成 Python 脚本到可执行文件(打包完成后,到设置的「Output Directory」中找到生成的。的「可视化 wrapper」,简化了基础打包流程,但本质上依赖。如果你的脚本需要读取外部文件(如图片、配置文件、数据库等),需在「的打包,尤其适合新手和简单场景。
2025-11-13 10:00:00
1003
原创 cx_Freeze和pyinstaller的区别
PyInstaller 以「易用性和兼容性」取胜,适合大多数场景尤其是快速分发;cx_Freeze 以「灵活性和启动速度」见长,适合对打包细节有严格要求的场景。实际使用中,PyInstaller 是更主流的选择,而 cx_Freeze 可作为复杂需求下的替代方案。等)的工具,但它们在设计目标、功能特性和适用场景上有显著区别。都是用于将 Python 脚本打包为可执行文件(
2025-11-13 09:56:57
781
原创 本地pc端替代bat文件的方法
(批处理)文件,还有多种替代方案可用于自动化执行命令、脚本或任务,这些方案往往功能更强大、语法更灵活,适用于不同场景。:Linux、macOS(原生支持);Windows(需通过 WSL、Git Bash 或 Cygwin 运行)这些方案在可读性、可维护性和功能扩展性上均优于传统。:Windows、macOS、Linux(跨平台):Windows(原生支持,推荐替代。在本地 PC 端,除了传统的。,适合不同场景的自动化需求。
2025-11-13 09:49:13
355
原创 pyinstaller的语法
pyinstaller --onefile --noconsole --name="文件夹启动器" folder_launcher.py。--noconsole :不显示控制台窗口(适合GUI程序)若脚本依赖外部文件(如图片、配置文件),需通过。自定义打包文件的输出路径(默认为当前目录的。--onefile :打包成单个exe文件。为可执行文件设置自定义图标(支持。--name :设置输出文件名。--icon :设置exe图标。
2025-11-13 09:48:15
448
1
原创 Tkinter Canvas 方案和OpenCV+PIL 方案的差别
这种方案本质是 “像素级帧处理”:先用 OpenCV 读取图像(处理视频帧时更明显),通过 PIL 转换格式,再叠加素材(本质是像素矩阵运算),最后将处理后的帧渲染到界面。每一步都涉及数据格式转换和内存操作,尤其是视频流场景下,逐帧处理会显著占用 CPU 资源,容易出现卡顿、延迟,且格式转换过程中可能因通道不匹配(如 RGB/BGR)导致显示异常。方法,底层会自动处理重绘,无需逐帧处理像素,因此效率较高,尤其适合轻量化交互场景。通过OpenCV和PIL处理每一帧来叠加素材,这种方式效率较低且容易出现问题。
2025-11-11 18:07:41
240
原创 [特殊字符] 常用 Maven 命令
最常用的命令 - 启动开发服务器。# 应该看到 pom.xml 文件。# 3. 启动应用(最重要)# 检查源代码是否存在。# 1. 清理(可选)# 在项目根目录检查。
2025-11-07 09:39:22
410
原创 SQLite 方言解决方案
java// 如果官方没有提供,需要自己创建// 注册 SQLite 支持的数据类型// 注册 SQLite 特有的函数// 覆盖其他方法来解决 SQLite 的特殊语法✅翻译器: 让 Hibernate/JPA 理解 SQLite 的语法✅适配器: 处理不同数据库之间的语法差异✅兼容层: 让 Spring Boot 能顺畅使用 SQLite。
2025-11-07 09:38:35
660
原创 H2 vs SQLite 全面对比
对于你的局域网协作平台推荐 SQLite,因为:✅ 部署简单(单文件)✅ 零配置✅ 适合中小型应用✅ 备份方便(复制文件即可)✅ 资源占用低只有在需要复杂SQL功能或高并发写入时才考虑H2。
2025-11-07 09:37:39
758
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅