蓝净云-CSDN博客

原创 Python性能限制GIL

这个范围不是某个数学定律，而是一个基于实际使用统计的工程权衡。因为日常代码里，这个区间的数字出现得最频繁。为什么是 0 到 256？因为它们用得最多。循环和计数，这里的i会反复从0取到99。索引和切片my_list[0]，这是数据结构操作的基础。状态码和标志位：函数成功返回0，失败返回-1，或者TrueFalse（对应10ASCII 字符集：计算机处理文本时，每个英文字符背后都是一个 0-127 的整数。如果这些“小数字”每次使用时都要在内存里创建新对象，用完再销毁。

2026-05-22 13:41:22 385

原创 Harness Engineering（驾驭工程）

简单来说，如果说大模型是一匹力量强大但难以预测的“野马”，那么 Harness Engineering 就是一套精密的“缰绳、马鞍和护具”。AI领域的“Harness Engineering”之所以成为一个新的热门概念，不是因为它发明了全新的工程目标，而是因为它将这些经典工程目标，应用到了一个。这意味着，当模型能力逐渐趋同，决定一个AI Agent（智能体）表现上限的关键，已经从模型本身，转移到了这套驾驭它的工程框架上。在AI领域之外，“Harness Engineering”所描述的核心目标——

2026-04-16 11:08:22 434

原创 RESP 协议的工作原理

状态 0：等待第一个字节，确定类型状态 1：正在读取\r\n分隔的整数（长度或数组元素个数）状态 2：正在读取批量字符串的实际内容状态 3：遇到数组，准备递归解析数组内的元素RESP 解析器 = 前缀驱动的状态机 + 长度前缀保证二进制安全 + 递归处理嵌套数组。

2026-04-05 11:29:29 355

原创 Socket 完全指南

类型：TCP vs UDP，面向连接 vs 无连接生命周期核心概念：文件描述符、字节序、阻塞/非阻塞实践陷阱：地址重用、粘包、信号中断、部分读写。

2026-04-02 17:02:53 514

原创 python包管理工具uv

uv由 Astral 公司（同样是知名 Python 代码检查工具 Ruff 的缔造者）开发。它的核心特性可以概括为“极速”和“全能”。由于采用 Rust 编写，uv在依赖解析和包安装上比传统的pip快 10-100 倍。例如，在缓存预热后，其速度甚至能比pip快 80-115 倍。这种性能提升来自于并行下载、全局模块缓存和高效的元数据处理等优化手段。uv的目标是替代一系列传统的 Python 工具，将多种功能集于一身。它就像一个瑞士军刀，包含了：pip：用于包安装。pip-tools：用于依赖锁定。

2026-03-09 09:09:19 608

原创如何学习GitHub项目

读概述 → 看结构 → 跑起来 → 钻代码 → 逛社区 → 动手改。

2026-03-02 10:51:56 1271

原创 markdown中的嵌套代码块

在 Markdown 中，如果需要在代码块（用三个反引号包裹）内部三个反引号本身，直接书写会导致代码块提前结束。

2026-03-02 10:42:01 389

原创创建github项目时的.gitignore是什么？

gitignore是一个文本文件，用于告诉 Git 哪些文件或目录不应该被纳入版本控制（即不会被git add或git commit追踪）。它通常放在仓库的根目录下，也可以放在子目录中（规则只对该目录及其子目录生效）。

2026-03-02 10:13:30 432

原创如何从pdf中提取带层级的标题结构

PDF 本质上是一个“打印格式”，它主要关注字怎么画在纸上，而不是内容的逻辑结构。因此，PDF 内部并没有直接存储“这是第一章正文”这样的标签。但是，我们可以利用 PDF 的 Outline (大纲/书签) 来重建这种层级结构。最强大的工具是 PyMuPDF (又名 fitz)。它比 PyPDF2 更快，且能更方便地提取目录（TOC）和页面内容。

2026-01-23 17:58:47 819

原创 k8s创建定时的 Python 任务（CronJob）

问题原因解决方案Pod 长时间处于Running状态Istio 注入了容器，它不会随主容器退出而退出在 CronJob 上添加注解。

2025-06-30 09:20:13 1377

原创安装llama-cpp-python

安装llama-cpp-python。

2025-02-27 10:15:25 879

原创 fastapi实现文件下载链接

浏览器访问http://ip:8001/download/content1.pdf即可下载文件。假设文件夹D:/codes/files下有个content1.pdf。

2025-02-15 12:30:59 787

原创 Linux执行一条命令并自动重试直到成功，自动化脚本

方式二：保存日志到指定路径，退出终端时运行不中断。i 插入模式，编辑文件。esc 退出编辑模式。

2025-02-14 23:20:25 650

原创 Helsinki-NLP/opus-mt-zh-en模型部署

【代码】Helsinki-NLP/opus-mt-zh-en模型部署。

2025-01-10 16:41:54 1504

原创 t5-small模型部署

【代码】t5-small模型部署。

2025-01-10 16:10:19 760

原创 nllb-200-distilled-600M模型部署

【代码】nllb-200-distilled-600M模型部署。

2025-01-10 15:38:26 996

原创显卡驱动、cuda、anaconda、docker安装

yes -> 输入安装路径 -> yes。显卡驱动560.35.03。

2024-12-26 16:14:11 585

原创 llama-3.1下载部署

点击头像->setting->access token 创建token。详情页填写申请后等待审核。

2024-07-30 09:23:47 1658

原创 Docker Compose安装milvus向量数据库单机版-milvus基本操作

下面演示如何使用PyMilvus库连接到Milvus数据库，创建数据表，插入数据，创建索引，进行搜索、查询、分页查询，以及删除数据表等操作。“params”: 这是一个包含搜索参数的字典，包括 “nprobe” 参数，它指定了搜索时的候选集数量，这里设置为10。“params”: 这是一个包含索引参数的字典，包括 “nlist” 参数，它指定了索引的列表数量，这里设置为128。指定了返回结果的最大数量，只返回满足条件的前4条数据，并指定了要返回的输出字段为 “random”。

2023-11-06 09:27:46 3195

原创计算文本相似度，输出相似度最高的n个

【代码】计算文本相似度，输出相似度最高的n个。

2023-10-26 17:25:05 1331

原创 PCA降维可视化

【代码】PCA降维可视化。

2023-10-21 14:52:47 556

原创绘制核密度估计图

核密度估计图（Kernel Density Estimation，KDE）是一种用于估计数据分布的非参数方法，通常用于可视化和理解数据的分布情况。它通过平滑地估计数据的概率密度函数（PDF）来显示数据的分布特征，尤其在连续变量上非常有用。KDE图通常表现为一条平滑的曲线，描述了数据在特定值附近的密度。这条曲线称为核密度估计。核密度估计是通过将每个数据点视为一个小的概率分布（通常是高斯分布或其他核函数）并将它们叠加而得到的。这样，核密度估计提供了一个对数据分布的连续估计，而不仅仅是一个直方图或散点图。

2023-10-21 14:31:23 11471 3

原创协同过滤推荐算法UserCF、ItemCF

cosine相似度计算简单方便，一般较为常用。但是，当用户的评分数据存在 bias 时，效果往往不那么好。

2023-10-20 18:18:23 724

原创从零开始搭建第一个django项目

django

2023-10-18 11:27:57 1131

原创 shap-An introduction to explainable AI with Shapley values

shap-An introduction to explainable AI with Shapley values

2023-09-24 17:06:26 878 2

原创 shap-Basic SHAP Interaction Value Example in XGBoost

`SHAP值`（Shapley Additive exPlanations）的主要思想就是Shapley值，Shapley值是一个来自合作博弈论（coalitional game theory）的方法，

2023-09-24 10:41:51 1793

原创 AIX360-CEMExplainer: MNIST Example

CEMBexplainer:MNIST示例官方代码在。

2023-09-23 19:06:35 379

原创 aix360-gec

记录一下学习过程，官方的代码在。

2023-09-23 14:58:01 383

原创 conda创建虚拟环境安装aix360

windows下在用户文件夹下.condarc，注意该文件是隐藏文件，pip文件夹下创建pip.ini配置文件。进入到用户文件夹，创建pip文件夹。

2023-09-23 10:20:28 536 1

翻译 Supported Model Frameworks/Formats - KServe

supported model frameworks/formats-kserve

2023-09-09 22:51:21 4988

原创黑马大数据学习笔记5-案例

聊天平台每天都会有大量的用户在线，会出现大量的聊天数据，通过对聊天数据的统计分析，可以更好的对用户构建精准的用户画像，为用户提供更好的服务以及实现=高ROI==的平台运营推广，给公司的发展决策提供精确的数据支撑。我们将基于一个社交平台App的用户数据，完成相关指标的统计分析并结合BI工具对指标进行可视化展现。FineBI 是帆软软件有限公司推出的一款商业智能（Business Intelligence）产品。

2023-08-06 23:47:18 1625

原创黑马大数据学习笔记4-Hive部署和基本操作

Hive部署和基本操作

2023-08-06 12:19:32 3579

原创黑马大数据学习笔记3-MapReduce配置和YARN部署以及基本命令

MapReduce配置和YARN部署以及基本命令

2023-07-30 23:21:35 5801 1

原创黑马大数据学习笔记2-HDFS基本操作

HDFS基本操作

2023-07-17 11:56:18 1734

原创黑马大数据学习笔记2-HDFS环境部署

HDFS环境部署

2023-07-11 15:09:02 2925

原创黑马大数据学习笔记0-环境配置

黑马

2023-07-09 16:58:33 1360

原创大数据02-HDFS的使用和基本命令

HDFS(Hadoop Distribute File System)是大数据领域一种非常可靠的存储系统，它以分布式方式存储超大数据量文件，但它并不适合存储大量的小数据量文件。同时HDFS是Hadoop和其他组件的数据存储层，运行在由价格廉价的商用机器组成的集群上的，而价格低廉的机器发生故障的几率比较高，因此HDFS在设计上采取了多种机制，在硬件故障的情况下保障数据的完整性。兼容廉价的硬件设备: 实现在硬件故障的情况下也能保障数据的完整性流数据读写：不支持随机读写的操作大数据集。

2023-02-19 00:01:13 3486

原创大数据01-Hadoop3.3.1伪分布式安装

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台，为用户提供了系统底层细节透明的分布式基础架构。Hadoop是基于Java语言开发的，具有很好的跨平台特性，并且可以部署在廉价的计算机集群中。Hadoop的核心是分布式文件系统HDFS（Hadoop Distributed File System）和MapReduce。

2023-02-14 16:01:23 1355

原创计算机组成原理（第三版）唐朔飞-课后习题（完整版）

计算机组成原理（第三版）唐朔飞-课后习题（完整版）

2022-10-15 22:15:12 323174 41

原创计算机组成原理（第三版）唐朔飞-第五章输入输出系统-课后习题

计算机组成原理（第三版）唐朔飞-第五章输入输出系统-课后习题

2022-10-15 22:14:14 66330 11

空空如也

空空如也