自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 收藏
  • 关注

原创 Python性能限制GIL

这个范围不是某个数学定律,而是一个基于实际使用统计的工程权衡。因为日常代码里,这个区间的数字出现得最频繁。为什么是 0 到 256?因为它们用得最多。循环和计数,这里的i会反复从0取到99。索引和切片my_list[0],这是数据结构操作的基础。状态码和标志位:函数成功返回0,失败返回-1,或者TrueFalse(对应10ASCII 字符集:计算机处理文本时,每个英文字符背后都是一个 0-127 的整数。如果这些“小数字”每次使用时都要在内存里创建新对象,用完再销毁。

2026-05-22 13:41:22 385

原创 Harness Engineering(驾驭工程)

简单来说,如果说大模型是一匹力量强大但难以预测的“野马”,那么 Harness Engineering 就是一套精密的“缰绳、马鞍和护具”。AI领域的“Harness Engineering”之所以成为一个新的热门概念,不是因为它发明了全新的工程目标,而是因为它将这些经典工程目标,应用到了一个。这意味着,当模型能力逐渐趋同,决定一个AI Agent(智能体)表现上限的关键,已经从模型本身,转移到了这套驾驭它的工程框架上。在AI领域之外,“Harness Engineering”所描述的核心目标——

2026-04-16 11:08:22 434

原创 RESP 协议的工作原理

状态 0:等待第一个字节,确定类型状态 1:正在读取\r\n分隔的整数(长度或数组元素个数)状态 2:正在读取批量字符串的实际内容状态 3:遇到数组,准备递归解析数组内的元素RESP 解析器 = 前缀驱动的状态机 + 长度前缀保证二进制安全 + 递归处理嵌套数组。

2026-04-05 11:29:29 355

原创 Socket 完全指南

类型:TCP vs UDP,面向连接 vs 无连接生命周期核心概念:文件描述符、字节序、阻塞/非阻塞实践陷阱:地址重用、粘包、信号中断、部分读写。

2026-04-02 17:02:53 514

原创 python包管理工具uv

uv由 Astral 公司(同样是知名 Python 代码检查工具 Ruff 的缔造者)开发。它的核心特性可以概括为“极速”和“全能”。由于采用 Rust 编写,uv在依赖解析和包安装上比传统的pip快 10-100 倍。例如,在缓存预热后,其速度甚至能比pip快 80-115 倍。这种性能提升来自于并行下载、全局模块缓存和高效的元数据处理等优化手段。uv的目标是替代一系列传统的 Python 工具,将多种功能集于一身。它就像一个瑞士军刀,包含了:pip:用于包安装。pip-tools:用于依赖锁定。

2026-03-09 09:09:19 608

原创 如何学习GitHub项目

读概述 → 看结构 → 跑起来 → 钻代码 → 逛社区 → 动手改。

2026-03-02 10:51:56 1271

原创 markdown中的嵌套代码块

在 Markdown 中,如果需要在代码块(用三个反引号包裹)内部三个反引号本身,直接书写会导致代码块提前结束。

2026-03-02 10:42:01 389

原创 创建github项目时的.gitignore是什么?

gitignore是一个文本文件,用于告诉 Git 哪些文件或目录不应该被纳入版本控制(即不会被git add或git commit追踪)。它通常放在仓库的根目录下,也可以放在子目录中(规则只对该目录及其子目录生效)。

2026-03-02 10:13:30 432

原创 如何从pdf中提取带层级的标题结构

PDF 本质上是一个“打印格式”,它主要关注字怎么画在纸上,而不是内容的逻辑结构。因此,PDF 内部并没有直接存储“这是第一章正文”这样的标签。但是,我们可以利用 PDF 的 Outline (大纲/书签) 来重建这种层级结构。最强大的工具是 PyMuPDF (又名 fitz)。它比 PyPDF2 更快,且能更方便地提取目录(TOC)和页面内容。

2026-01-23 17:58:47 819

原创 k8s创建定时的 Python 任务(CronJob)

问题原因解决方案Pod 长时间处于Running状态Istio 注入了容器,它不会随主容器退出而退出在 CronJob 上添加注解。

2025-06-30 09:20:13 1377

原创 安装llama-cpp-python

安装llama-cpp-python。

2025-02-27 10:15:25 879

原创 fastapi实现文件下载链接

浏览器访问http://ip:8001/download/content1.pdf即可下载文件。假设文件夹D:/codes/files下有个content1.pdf。

2025-02-15 12:30:59 787

原创 Linux执行一条命令并自动重试直到成功,自动化脚本

方式二:保存日志到指定路径,退出终端时运行不中断。i 插入模式,编辑文件。esc 退出编辑模式。

2025-02-14 23:20:25 650

原创 Helsinki-NLP/opus-mt-zh-en模型部署

【代码】Helsinki-NLP/opus-mt-zh-en模型部署。

2025-01-10 16:41:54 1504

原创 t5-small模型部署

【代码】t5-small模型部署。

2025-01-10 16:10:19 760

原创 nllb-200-distilled-600M模型部署

【代码】nllb-200-distilled-600M模型部署。

2025-01-10 15:38:26 996

原创 显卡驱动、cuda、anaconda、docker安装

yes -> 输入安装路径 -> yes。显卡驱动560.35.03。

2024-12-26 16:14:11 585

原创 llama-3.1下载部署

点击 头像->setting->access token 创建token。详情页填写申请后等待审核。

2024-07-30 09:23:47 1658

原创 Docker Compose安装milvus向量数据库单机版-milvus基本操作

下面演示如何使用PyMilvus库连接到Milvus数据库,创建数据表,插入数据,创建索引,进行搜索、查询、分页查询,以及删除数据表等操作。“params”: 这是一个包含搜索参数的字典,包括 “nprobe” 参数,它指定了搜索时的候选集数量,这里设置为10。“params”: 这是一个包含索引参数的字典,包括 “nlist” 参数,它指定了索引的列表数量,这里设置为128。指定了返回结果的最大数量,只返回满足条件的前4条数据,并指定了要返回的输出字段为 “random”。

2023-11-06 09:27:46 3195

原创 计算文本相似度,输出相似度最高的n个

【代码】计算文本相似度,输出相似度最高的n个。

2023-10-26 17:25:05 1331

原创 PCA降维可视化

【代码】PCA降维可视化。

2023-10-21 14:52:47 556

原创 绘制核密度估计图

核密度估计图(Kernel Density Estimation,KDE)是一种用于估计数据分布的非参数方法,通常用于可视化和理解数据的分布情况。它通过平滑地估计数据的概率密度函数(PDF)来显示数据的分布特征,尤其在连续变量上非常有用。KDE图通常表现为一条平滑的曲线,描述了数据在特定值附近的密度。这条曲线称为核密度估计。核密度估计是通过将每个数据点视为一个小的概率分布(通常是高斯分布或其他核函数)并将它们叠加而得到的。这样,核密度估计提供了一个对数据分布的连续估计,而不仅仅是一个直方图或散点图。

2023-10-21 14:31:23 11471 3

原创 协同过滤推荐算法UserCF、ItemCF

cosine相似度计算简单方便,一般较为常用。但是,当用户的评分数据存在 bias 时,效果往往不那么好。

2023-10-20 18:18:23 724

原创 从零开始搭建第一个django项目

django

2023-10-18 11:27:57 1131

原创 shap-An introduction to explainable AI with Shapley values

shap-An introduction to explainable AI with Shapley values

2023-09-24 17:06:26 878 2

原创 shap-Basic SHAP Interaction Value Example in XGBoost

`SHAP值`(Shapley Additive exPlanations)的主要思想就是Shapley值,Shapley值是一个来自合作博弈论(coalitional game theory)的方法,

2023-09-24 10:41:51 1793

原创 AIX360-CEMExplainer: MNIST Example

CEMBexplainer:MNIST示例官方代码在。

2023-09-23 19:06:35 379

原创 aix360-gec

记录一下学习过程,官方的代码在。

2023-09-23 14:58:01 383

原创 conda创建虚拟环境安装aix360

windows下在用户文件夹下.condarc,注意该文件是隐藏文件,pip文件夹下创建pip.ini配置文件。进入到用户文件夹,创建pip文件夹。

2023-09-23 10:20:28 536 1

翻译 Supported Model Frameworks/Formats - KServe

supported model frameworks/formats-kserve

2023-09-09 22:51:21 4988

原创 黑马大数据学习笔记5-案例

聊天平台每天都会有大量的用户在线,会出现大量的聊天数据,通过对聊天数据的统计分析,可以更好的对用户构建精准的用户画像,为用户提供更好的服务以及实现=高ROI==的平台运营推广,给公司的发展决策提供精确的数据支撑。我们将基于一个社交平台App的用户数据,完成相关指标的统计分析并结合BI工具对指标进行可视化展现。FineBI 是帆软软件有限公司推出的一款商业智能(Business Intelligence)产品。

2023-08-06 23:47:18 1625

原创 黑马大数据学习笔记4-Hive部署和基本操作

Hive部署和基本操作

2023-08-06 12:19:32 3579

原创 黑马大数据学习笔记3-MapReduce配置和YARN部署以及基本命令

MapReduce配置和YARN部署以及基本命令

2023-07-30 23:21:35 5801 1

原创 黑马大数据学习笔记2-HDFS基本操作

HDFS基本操作

2023-07-17 11:56:18 1734

原创 黑马大数据学习笔记2-HDFS环境部署

HDFS环境部署

2023-07-11 15:09:02 2925

原创 黑马大数据学习笔记0-环境配置

黑马

2023-07-09 16:58:33 1360

原创 大数据02-HDFS的使用和基本命令

HDFS(Hadoop Distribute File System)是大数据领域一种非常可靠的存储系统,它以分布式方式存储超大数据量文件,但它并不适合存储大量的小数据量文件。同时HDFS是Hadoop和其他组件的数据存储层,运行在由价格廉价的商用机器组成的集群上的,而价格低廉的机器发生故障的几率比较高,因此HDFS在设计上采取了多种机制,在硬件故障的情况下保障数据的完整性。兼容廉价的硬件设备: 实现在硬件故障的情况下也能保障数据的完整性流数据读写:不支持随机读写的操作大数据集。

2023-02-19 00:01:13 3486

原创 大数据01-Hadoop3.3.1伪分布式安装

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce。

2023-02-14 16:01:23 1355

原创 计算机组成原理(第三版)唐朔飞-课后习题(完整版)

计算机组成原理(第三版)唐朔飞-课后习题(完整版)

2022-10-15 22:15:12 323174 41

原创 计算机组成原理(第三版)唐朔飞-第五章输入输出系统-课后习题

计算机组成原理(第三版)唐朔飞-第五章输入输出系统-课后习题

2022-10-15 22:14:14 66330 11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除