fegggye-CSDN博客

原创 PyO3 Class 详解 - 在 Python 中使用 Rust 类

本文详细介绍了使用PyO3在Rust中定义类并在Python中使用的方法。主要内容包括：1)基本类定义语法；2)构造函数实现；3)Python对象获取方法(PyRef/PyRefMut)；4)析构函数和继承机制；5)类配置参数(name/freelist等)；6)使用限制(生命周期/泛型/线程安全)；7)内部可变性管理；8)字段属性配置。文章还提供了最佳实践建议，如简单类型优先、合理使用宏等，帮助开发者高效构建高性能Python扩展。PyO3实现了Rust与Python的优雅互操作。

2025-12-17 15:27:50 913

原创创建一个rust写的python库[signatures和错误处理]

的 Python 模块，它包含一个类。照例先创建初始话选pyo3。修改src/lib.rs。这段代码定义了一个名为。

2025-12-16 10:38:44 221

原创创建一个rust写的python库

-------报错处理---------------------------------------4.编译库安装到当前python环境（以示例lib.rs为基准）windows上安装rustup-init.exe。创建时选择pyo3,然后就会产生若个项目文件。重新安装importlib-metadata。其中src里面有个lib.rs给出了示例。2.安装maturin。5.编写测试py脚本。

2025-12-15 13:31:43 354

原创 numpy转halcon HImage示例

摘要：该代码实现了一个Python与Halcon图像处理的接口，使用Pybind11将NumPy数组转换为Halcon图像格式。主要功能是接收RGB三通道的3D NumPy数组，通过并行处理分离颜色通道，并创建对应的Halcon图像对象。代码利用OpenMP多线程优化，根据CPU核心数分割任务以提高处理效率，最终返回处理后的图像数据。该模块可作为Python调用Halcon图像处理功能的桥梁，适用于高性能图像处理应用。

2025-07-23 18:12:03 191

原创 deepseek v3网络结构源码分析笔记

简单说来就是一种新的计算QKV的方式，原始的QKV计算是通过3个矩阵运算对hidden state分别计算QKV，KV需要缓存在网络中，现在通过一个中间步骤计算QKV，不直接缓存KV而是缓存下图阴影部分，减少了 K 和 V 矩阵的存储和计算开销。计算最终输出的时候有“navie”和“absorb”方式，代码实际用的是absorb方式，区别在于navie模式模型存贮cache的是k和v，而absorb方式存储的是kv_cache和pe_cache。2. TransformerBlock结构：和上图类似。

2025-02-08 11:35:18 2193 2

原创 Cython学习笔记和例程

编译运行Cython代码有好几种方式，没有必要全部掌握，可以根据需要选择合适的方式。3.常规的编译方法，使用setuptool或distutils库。这种方式可以把cython部分代码编译成动态连接库，方便部署和源码的加密隐藏。2.使用pyximport可以直接import使用，import时会自动编译，使用比较方便。cython使用结构体用’.'访问，而不需要使用’->',在转成C语言时会自动转换。1. 使用Ipython进行cython函数的互动编译和使用，适合原型调试。3.Cython中的C指针。

2024-05-24 11:48:24 570

原创自注意力机制理解

这样，我们就可以通过自注意力机制动态地为每个词生成其上下文表示，使得模型能够更好地理解整个句子的语义结构。这种方法允许模型同时关注句子中不同位置的词，并根据它们之间的关系来计算每个词的表示，从而更好地捕捉句子的语义信息。这里就是把"The"的原始词向量[2.1,1.5,0.7]，通过自注意力机制结合其他词向量和QKV转换成结合了上下文信息的向量表示[-0.5228,1.5181]接下来，我们将使用自注意力机制来为每个词生成上下文表示。首先，我们需要计算每个词的查询向量。同样的方式计算其他词的。

2023-11-14 14:35:50 320

原创 python调用C++并突破GIL限制（非多进程）

2.编写setup.py利用setuptools和pybind11构建模块，这里需要确保你的环境已经安装了pybind11，可以使用”pip install pybind11“来安装。python的多线程由于GIL的限制，无法使用多核，如果想使用多核就需要用到多进程，但多进程资源消耗巨大，所以比较合理的方法是在计算密集型任务上使用C/C++来实现构建python模块。下面的示例利用了pybind11把c++函数封装成python类，然后再使用python来调用模块。3. 使用测试样例测试效果。

2023-11-13 10:56:55 1580

原创 numba加速测试

numba对于数据量的的计算优化效果明显，nogil开启对多线程大约有20%以上的优化。

2023-11-03 11:33:48 297

原创 python通过ctypes传参numpy给c语言函数

numpy数组转换成c_void_p类型，然后传参给c语言函数，c语言函数中指针强转到需要的数据类型，然后再处理。这样即可改变numpy数组中的数值实现各种计算。示例实现了numpy数组加上100并通过另外的数组的指针获取返回值。该方法可以实现python一些算子的速度优化（有无因患要后续确认）

2023-08-15 22:10:10 546

原创 pytorch实现图像投影变换

还是那个问题，数据在cpu->GPU拷贝时会慢，单GPU的计算耗时很短。

2023-07-20 18:46:35 695

原创 pytorch实现图像remap

【代码】pytorch实现图像remap。

2023-07-20 11:22:18 745

原创 tensorrt 安装和事例程序跑通记录

【代码】tensorrt 安装和事例程序跑通记录。

2023-07-01 17:31:15 1241

原创 CUDA规约算法（加和）

这样同时保证了wrap内指令的一致，也保证了bank的访问连续，该方法在绝大多数情况基本已经可以满足要求了，但是其实在kernel执行时，也会有1半的线程空闲，所以还可以继续优化。以上规律就是满足t%(2*stride)==0，stride为1，2，4，8。以图为例，第0～7个线程，让第0～7和第8～15数字相关（stride=8）stride=1: 让线程0～7，访问第1，3，5，7，9个数字，stride=2: 让线程0～3，访问第1，4，8, 12个数字。第0个线程会和第1，2，4，8发生关系。

2023-01-15 20:41:44 1056

原创用CUDA 实现图像remap

下面是对应remap核函数的实现：remap就是把目标图像根据map里的对应坐标里的像素填补到结果图像里。函数调用过程：载入图像和坐标，准备remap核函数的数据和显存，执行函数后把结果拷贝回内存中。图像remap在图像和视频帧上经常用于仿射投影变换，畸变矫正，图像拼接。

2023-01-11 19:44:32 1122

原创 vscode C++ opencv配置示例2(cmake)

【代码】vscodeC++opencv配置示例2(cmake)

2023-01-05 14:44:40 423

原创 vscode C++ opencv配置示例1

【代码】vscode C++ opencv配置示例1。

2023-01-04 22:03:26 323

原创 vscode CUDA C++/C配置记录示例(2)

【代码】vscode CUDA C++/C配置记录示例(2)

2022-12-28 21:49:01 562

原创 vscode CUDA C++配置记录示例(1)

【代码】vscode CUDA C++配置记录示例(1)

2022-12-28 21:31:54 484

原创 ubuntu1804命令行安装nvidia显卡驱动

【代码】ubuntu1804命令行安装nvidia显卡驱动。

2022-12-13 14:58:31 652

原创 python ctypes笔记

1.字符串,int,float,bool传参。6.传参结构体　结构体数组，返回结构体指针。2.可变字符串(buffer)传参。5.传参指针，返回指针地址。3.返回值为char*

2022-10-17 17:21:15 665

原创 python通过ctypes调用海康网络sdk取流

项目中经常需要使用海康的网络摄像头,做视频图像算法经常会用到rtsp流,但是rtsp一般很难保证实时性且解码效率不能保证.通过海康给的python的demo,对模块进行封装以方便python像调用opencv的VideoCaputure一样调用.目录结构如下├── HKCam.py #自己写的封装├── HCNetSDK.py # SDK给定├── PlayCtrl.py #SDK给定├── lib│ ├── linux│ │ ├── HCNetSDKCom│ │ │...

2022-05-27 14:01:40 3542 28

原创爬虫数据解析

BS4:<html lang="en"><head> <meta charset="UTF-8" /> <title>测试bs4</title></head><body> <div> <p>百里守约</p> </div> <div class="song"> <p>李清照</p> <p>王安石&l

2022-03-29 11:25:02 430 1

原创 C++和python进行视频socket传输通信（实时）

需求：通过C++程序获得视频流，传输给python程序并进行处理。方法：Python构建socket服务，C++连接并发送祯信息。（本人C++不太会，查了很多资料）服务端（python）接收数据并显示import socketimport osimport sysimport structimport numpy as npimport cv2import time def socket_service_image(): try: s = soc

2021-12-21 11:26:40 1942

原创 python命名管道示例

命名管道可用于进程间通信，下面示例表示1个进程在发送帧，另一个在获取帧并播放。（可以跨语言）继续编辑writer.pyimport os import timeimport uuidimport cv2import numpy as npwrite_path = "/tmp/vsd_fifo.pipe"if os.path.exists(write_path): os.remove(write_path) os.mkfifo(write_path) #rf =.

2021-12-16 22:30:24 1521

原创使用Tensorrt的python api 部署支持动态batch的yolov5s-face

上次尝试了使用Tensorrt的python api 部署支持动态batch的yolov5s_u012160945的博客-CSDN博客系统环境:ubuntu 1804cuda11.3tensorrt 8.2.06显卡2080pytorch 1.10.0onnx 1.10.2onnx-simplifier 0.3.6步骤１：导出onnx 模型(参考https://github.com/shouxieai/tensorRT_Pro)1.1 下载yolov5项目并修改相关代码，目的是减少导出onnx的复杂度，

2021-12-03 11:35:57 1478 2

unet_pp_slim_centernet.py

空空如也