haven-852-CSDN博客

原创 LLM当中的Function calling

摘要：Function Calling是AI应用中的核心能力，它使大语言模型不仅能回答问题，还能通过调用预定义函数执行实际任务（如查询天气、操作数据库等）。该技术实现了AI的意图识别和参数提取功能，让模型能从自然语言中准确获取函数所需参数。文章通过Python代码示例展示了函数注册、模型决策和执行流程，并推荐了一个简单的GitHub项目供初学者参考。Function Calling本质是为AI模型提供"行动力"，使其能够与外部系统交互并执行具体操作。

2026-03-12 11:38:20 31

原创 Data Agent是什么？一文讲清楚

摘要： DataAgent是基于大模型的智能数据分析助手，通过自然语言交互降低使用门槛，实现"开口即得"的数据查询与洞察。其核心技术包括自然语言转SQL/代码/API，支持智能建模、预测分析和自动化报表生成。相比传统BI工具，DataAgent具备主动性（异常预警）、智能性（AI算法集成）和适应性（个性化分析）三大特性。典型应用覆盖经营看板、销售预测、设备监控等场景，技术架构涵盖数据接入、智能分析和多模态交互层。评测需关注业务价值、性能可靠性及效率指标，未来将推动企业从"工具使

2025-11-25 17:16:20 1214

原创每日一题DEEP_ML-卡方分布（Chi-Squared Distribution）

卡方分布是一种重要的概率分布，常用于统计推断中的假设检验和方差分析。其定义为k个独立标准正态变量平方和的分布，形状由自由度k决定：k=1时偏态明显，k增大时逐渐接近正态分布。卡方分布具有非负性，期望为k，方差为2k。主要应用于方差检验、拟合优度检验、独立性检验等统计场景。计算其概率密度需使用伽马函数，可通过Python代码实现。随着自由度增加，卡方分布会趋近于N(k,2k)的正态分布。

2025-08-26 23:40:39 650

原创 faiss上的GPU流程，GPU与CPU之间的联系

GPU使用流程分为初始化、数据加载、计算和优化四个阶段。首先初始化GPU资源并创建索引类型（如GpuIndexFlatL2）。数据从CPU内存传输到GPU显存后，通过并行计算构建索引并执行近邻搜索。FAISS优化了数据传输效率，支持多GPU并行和分片处理。结果返回CPU后清理资源。FAISS的GPU索引与CPU兼容，支持自动数据转换和PyTorch张量直接输入，同时提供灵活的资源管理和临时内存优化。支持的索引类型包括GpuIndexFlat、GpuIndexIVFFlat等，适用于不同精度需求。

2025-06-12 15:51:39 1102

原创使用cmake安装faiss-GPU.so(无网或者内网情况下）

GPU使用流程主要包括安装NVIDIA驱动、CUDA Toolkit并配置环境变量，最后编译安装FAISS-GPU版本。首先通过nvidia-smi和nvcc -v验证驱动和CUDA安装，然后安装必要的开发工具和依赖库。在编译FAISS时需开启GPU支持，指定CUDA路径和架构，并处理测试依赖项。最后通过修改构建配置完成安装，可使用nvidia-smi监控GPU使用情况。整个过程需确保硬件、驱动、CUDA和软件环境的正确配置与兼容性。

2025-06-12 15:50:05 719

原创第一季度过程

介绍量化的第一季度学习计划

2025-06-09 10:16:26 882

原创量化策略聚焦方向与里程碑计划

介绍量化分析的进行方向与里程碑

2025-06-09 10:13:24 1022

原创最大似然估计（Maximum Likelihood Estimation, MLE）详解

最大似然估计（MLE）通过最大化观测数据的概率来估计参数。经典例子包括正态分布的均值/方差估计（$\mu^=\frac{1}{n}\sum x_i$）和二项分布参数估计（$p^*=k/n$）。在大模型（如GPT、BERT）中，MLE是损失函数（如交叉熵）的基础，但需结合正则化、优化算法（如Adam）应对过拟合和高维问题，并扩展至生成模型（如GAN）。其局限性（过拟合、非凸优化）通过贝叶斯方法、数据增强等技术缓解，成为统计学习与深度学习的核心方法论

2025-05-24 15:59:45 5047

原创贝叶斯理论

讲解贝叶斯概率

2025-05-24 10:43:48 882

原创 win11安装Joplin Server私有化部署(docker)

win11安装Joplin Server私有化部署，并且进入到joplin里面创建新的用户

2025-05-15 12:56:43 1634

原创基于JL的提升--SJLT

JL的提升，使用SJLT稀疏矩阵进行降维

2025-04-30 09:38:44 1044

原创编译faiss

编译faiss的过程

2025-04-30 09:34:33 600

原创 PDX列式存储

介绍论文PDX，介绍列存会比行存的方式更快的存储下来

2025-04-15 16:52:26 1050

原创 J-L引理（随机投影，Random Projection）

讲解随机投影里面的J-L引理

2025-04-15 16:49:16 1286

原创 duckdb源码阅读学习路径图

duckdb数据库源码阅读

2025-04-08 17:03:26 570

原创理解 DuckDB 的逻辑计划（Logical Plan）、优化器（Optimizer）和物理执行计划模块的工作流程

理解duckdb中的逻辑计划，优化器和物理执行的工作流程

2025-04-08 17:01:34 1306

原创测试duckdb运行所需的文件

测试duckdb在嵌入式设备里面所需要的最小文件内容

2025-04-02 15:25:32 813

原创 duckdb不支持向量

测试duckdb不支持向量

2025-04-02 15:21:17 488

原创 duckdb、PG、Faiss和Milvus调研与对比

数据库的对比调研

2025-04-01 15:20:20 1376

原创统计duckdb的文件代码行数

统计duckdb代码行数的简单python脚本

2025-04-01 15:15:00 335

原创端侧设备（如路由器、家庭网关、边缘计算盒子、工业网关等）的典型系统、硬件配置和内存大小

端侧设备（如路由器、家庭网关、边缘计算盒子、工业网关等）的典型系统、硬件配置和内存大小

2025-03-28 16:04:03 972

原创理解CMakeLists.txt文件

理解CMakeLists文件

2025-03-28 16:01:34 983

原创 duckDB安装

DuckDB安装

2025-03-27 16:33:18 974

原创 duckDB使用

DuckDB使用

2025-03-27 16:32:25 1639

原创 ivfsq的码表理解

ivfsq码表的理解

2025-03-24 14:51:48 1131

原创 PostgreSQL并行化内容

帮助快速了解PostgreSQL的并行化过程

2025-03-24 14:47:56 1312

原创向量数据库与RAG模型在嵌入式设备中使用ivfsq索引的重要性

主要介绍ivfsq索引在嵌入式设备当中相比于ivfflat索引的重要性

2025-03-12 11:13:14 1243

原创 ivfsq参数设置

根据faiss的内容，在PostgreSQL的拓展pgvector里面添加了ivfsq索引中的一些功能的设计

2025-03-12 11:07:09 711

原创 elkan K-Means算法

详细记录了elkan kmeans算法在ivfflat当中的计算过程，如何去寻找桶中心

2025-02-24 09:13:47 1109

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-7

faiss里面的搜索过程

2024-12-25 16:35:20 876

原创软工本科生毕设-区块链设计模式知识库系统

以区块链设计模式为例子，帮助本科生设计自己的知识库系统

2024-12-17 14:40:38 1678

原创 postgresql与pgvector安装与使用

postgresql的安装与使用

2024-12-02 09:13:11 897

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-4

分析测试代码，并以测试代码整理各个函数的调用栈，为后续的调用分析打下基础。

2024-11-27 17:10:20 1301

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-6

分析里面add流程，查看ivfsq训练得到了vmin和vdiff之后，如何对库中的向量如何进行处理

2024-11-27 16:35:07 488

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-5

详细分析faiss里面的train函数的调用过程

2024-11-27 16:28:21 555

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-3

进入到调试，并修改相对应的代码，查看里面的内容

2024-11-27 09:17:33 1100

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-2

介绍ivfsq里面的相关函数

2024-11-26 19:28:37 1438

原创 gbd调试ivfflat索引

gdb调试pgVector中ivfflat索引流程

2024-11-25 16:25:33 973

原创 faiss库中ivf-sq（ScalarQuantizer，标量量化）代码解读-1

分解faiss源代码，帮助大家理解ivf-sq的流程以及ivf-sq转移到pgsql上进行重写

2024-11-25 16:23:02 1690

原创 C++指针使用指南

C++指针使用指南

2024-11-13 15:23:39 875

投资分析，那么我该怎么去全面了解一个行业和一家公司呢？

要系统、全面地了解一个行业和一家公司，可以分层次进行：先看宏观与行业，再看公司本身，最后结合估值与风险控制。下面给你一个可操作的框架与关键指标清单，便于落地执行。

2025-11-24

线性代数中奇异值分解与特征值分解的理论及其在大模型中的应用解析

内容概要：文章详细介绍了奇异值分解（SVD）和特征值分解（EVD）的定义、公式、核心区别及其在大模型中的应用。EVD仅适用于方阵，将矩阵分解为特征值和特征向量的组合，揭示矩阵的缩放、旋转特性；SVD适用于任意矩阵，分解为三个特定矩阵的乘积，揭示矩阵行空间和列空间的结构。EVD应用于主成分分析、矩阵稳定性分析和物理系统建模；SVD用于降维与压缩（如图像压缩、潜在语义分析）、推荐系统（如协同过滤）、模型加速与压缩（如Transformer中的注意力计算加速）以及初始化与正则化等方面。; 适合人群：对线性代数有一定了解，从事机器学习、数据科学或相关领域的研究人员和技术人员。; 使用场景及目标：①理解EVD和SVD的基本理论，掌握其数学推导和应用场景；②利用EVD进行主成分分析、矩阵稳定性分析等任务；③运用SVD进行降维、压缩、推荐系统构建及模型优化。; 其他说明：文章不仅提供了理论知识，还结合实际案例（如PCA、Transformer中的SVD应用），帮助读者更好地理解和应用这两种分解方法。建议读者在学习过程中结合具体实例进行实践，以加深理解。

2025-05-24

南京大学数理逻辑考试内容

数理逻辑这门课程主要为了帮助计算机学生去了解算法的一些逻辑基础，考试的内容主要聚焦于课后习题，基本上都是原题，那么就需要去熟知所有的课后习题。这里整理了所有的课后习题的答案，帮助学生去进一步巩固课后知识点

2025-01-28

性格测试-用于记录自己的个性

用于个人

2024-11-03

南京大学毕业生答辩PPT模板

主要是用于南京大学各个学院的毕业生答辩的PPT模板，用于毕业答辩的标准模板！！！

2024-09-02

南京大学软件学院专硕论文编写模板

用于南京大学软件学院硕士生论文编写的模板，这个模板来自于南京大学软件学院的latex模板，专门用于南大软院硕士生论文编写的模板，只有进入南大的人可以在南大的latex编辑页面（https://tex.nju.edu.cn/console）可用，外人下载没有任何意义，望周知。

2024-09-02

南京大学软件学院学硕论文编写模板

2024-09-02

软件学报2016年排版样例模板

2022-06-07

Off-chaining Models and Approaches to Off-chain Computations

区块链是不同计算和经济学概念的组合，主要包括对等网络，不对称密码学，共识协议，分散存储，分散计算和智能合约以及激励机制。这些概念的综合将区块链定位为新技术并同时作为可编程平台和网络。这里引入的链下计算是将区块链上进行复杂的运算转移到链下，让链上和链下的任务区分开来，减轻链上不断为了交易而彼此之间相互计算而消耗的资源，从而让链上变得更轻，从而提高区块链的性能。

2022-01-29

用来查看AIGC的数字标注产业的前景

数据标注，正迎来关键时刻。作为AI认识世界的起点，数据标注本质上是将现实世界信息结构化、数字化，充分发挥数据信息的价值。⼤模型时代到来，AIGC众多垂直场景落地，以及通⽤智能、具⾝智能等前沿领域探索，与⾼质量、专业化的场景数据密不可分，数据标注从劳动密集型加速朝着知识密集型转型，⾏业壁垒进⼀步提⾼。作为底层基础服务，数据标注贯穿⼤模型全⽣命周期（训练测试、评估验证和应⽤迭代）。⼀⽅⾯，牵涉关键Know-how，更多⼤模型公司/AI企业选择⾃建标注团队和管线；另⼀⽅⾯，上下游合作关系将更为紧密和耦合，专业数据服务提供商更多机会将在垂直领域，帮助企业完成私有化部署。机遇与挑战并存。合成数据作为新衍⽣赛道，潜在市场空间巨⼤。与此同时，数据标注标准难以统⼀、数据处理流程尚未规范，⾼学历多领域多专业成为标注⼈才的硬指标。

2024-07-10

用于解决Matlab路径的问题

新手使用matlab会遇到文件夹的问题：第一，新建一个脚本，Ctrl+S时怎么弹出我们预想的位置？这个简单，搜一下怎么修改默认保存文件夹，同时也是工作路径，很轻松就能完成修改。第二，这个问题可能就有些“坑”了~ 我们已经修改默认文件夹（工作路径）了，然后新建了一个.m文件，Ctrl+S了，信心满满地去运行程序，准备出结果的时候，我们发现它还是会出现如上图的提示。这是怎么一回事呢？我们不是已经修改了工作路径，这时MATLAB应该自动寻找到默认工作路径下刚刚新建的文件然后执行啊，怎么还会出现“不在工作路径里”的提示，表示它找不到这个文件呢。

2023-10-14

利用VMWare来部署Hyperledger Fabric

在VMWare安装Ubuntu系统和VM工具，之后安装相关的安装包，Docker和docker-compose，之后安装go语言开发换景，之后部署Hyperledger Fabric

2023-10-09

南京大学服务器上搭建UOJ系统的保姆级步骤

从申请南京大学服务器开始，然后搭建docker系统，之后创建UOJ系统用于发布课堂作业，用于帮助助教进行UOJ系统搭建，帮助助教更好的完成老师布置的任务

2023-09-30

leetcode动态规划算法详细讲解

动态规划，英⽂：Dynamic Programming，简称DP，如果某⼀问题有很多重叠⼦问题，使⽤动态规划是最有效的。所以动态规划中每⼀个状态⼀定是由上⼀个状态推导出来的，这⼀点就区分于贪⼼，贪⼼没有状态推导，⽽是从局部直接选最优的.

2023-08-29

OneDrive共享文档使用方法

使用OneDrive进行文档共享使用方法

2023-08-11

c3p0数据库连接文件

2022-11-13

电子商务详细内容-创新业务

2022-07-06

高级计算机网络相关内容

计算机网络、路由器的链路、静态路由、动态路由链接方式、路由解释等等

2022-06-15

高级软件设计-设计模式

敏捷开发的相关内容和实践

敏捷开发相关知识点和方法+利用敏捷开发多邮箱管理系统实践

2022-06-15

软件需求工程的制定过程

需求确认过程

2022-06-15

IEEE论文模板+自我翻译论文模板

IEEE

2022-06-15

高级算法-nju-onlineJudge-master-java和python的答案

高级算法-nju-onlineJudge-master-java和python的答案+考试题目

2022-06-15

数据仓库和知识发现相关笔记

记录一些关于学习数仓的笔记，主要用于自我复习使用

2022-06-08

南京大学软件学院研究生第一学期相关考试资料汇总

主要涉及数据仓库和软件工程A4纸，这些是比较实用的。

2022-06-07

山东大学时间序列相关课件

数学专业方面的专业知识，需要一定的概率论知识的人

2022-05-26

操作系统+软件工程+计算机网络相关PPT资源

操作系统+软件工程+计算机网络相关PPT资源，关于相关南京大学软件学院自主命题842考试资料的相关知识点，关于南京大学本科上课相关PPT，更加详细了解到南京大学对于各个知识点的详细了解

2022-05-26

飞机大战源码地址--用于帮助初学者理解Java--java练手项目

项目功能： 1、窗体绘制 2、图片与字体的绘制 3、背景图片的循环移动 4、鼠标控制飞机的移动位置 5、子弹的批量生成 6、敌机在随机位置批量生成 7、子弹和飞机的碰撞检测 8、爆炸动画效果的实现 9、计分面板的实现 10、游戏的暂停功能 11、游戏的通关设置 12、血条的绘制 13、双缓存解决画面闪存问题 14、集合的适用和优化

2022-05-16

overleaf中文模板+论文翻译（区块链共识算法-Monoxide）

通过overleaf将论文Monoxide进行了一遍翻译，并且创建了overleaf的中文模板

2022-05-13

走向后量子区块链：抗量子计算攻击的区块链加密综述

区块链和其他分布式账本技术（DLT）在过去几年中有了显著的发展，由于其提供透明度、冗余性和问责制的能力，已被建议用于许多应用程序。在区块链的情况下，这些特征是通过公钥加密和散列函数提供的。然而，量子计算的快速发展为在不久的将来执行基于Grover和Shor算法的攻击提供了可能性。这类算法威胁到公钥密码和散列函数，迫使重新设计区块链，以利用能够抵御量子攻击的密码系统，从而创建被称为后量子、量子证明、量子安全或量子抵抗的密码系统。为此，本文首先研究了后量子密码系统的现状，以及如何将其应用于区块链和DLT。此外，还研究了最相关的后量子区块链系统及其主要挑战。此外，还对最有前途的区块链后量子公钥加密和数字签名方案的特征和性能进行了广泛的比较。因此，本文试图为未来的区块链研究人员和开发人员提供一个关于后量子区块链安全的广泛视角和有用的指导方针。 shor和grover和分别针对区块链快速生成区块和检测哈希冲突来替换区块链的区块。第二节描述了与区块链及其安全原语相关的基本概念。第三节研究量子攻击对区块链公钥安全方案和最流行的哈希函数的影响。

2022-03-11

简洁非交互式零知识证明参数（zk-SNARKS），本文系统介绍了zk-SNARKS的数学理论，需要有一定的数学功底的人进行阅读

我们构建了一个系统，为冯·诺依曼RISC体系结构上的程序执行提供简洁的非交互式零知识证明（zk SNARKs）。该系统由两部分组成：一个用于验证算术电路可满足性的密码验证系统，以及一个用于将程序执行转换为此类电路的电路生成器。与之前的工作相比，我们对这两个组件的设计在功能和效率方面都有所提高，如下所示。我们的电路生成器是第一个通用的：它不需要知道程序，只需要知道它的运行时间。此外，输出电路的大小取决于程序大小（而不是乘法），从而允许验证较大的程序。加密证明系统通过利用新算法和根据协议定制的配对库，提高了证明和验证时间。我们对我们的系统进行了评估，以获得多达10000条指令的程序，运行多达32000个机器步骤，每个步骤都可以任意访问随机存取存储器；并演示了如何执行使用即时编译的程序。我们的证明在80位安全性时长230字节，在128位安全性时长288字节。不管原始程序的运行时间如何，典型的验证时间为5毫秒。

2022-03-28

研究生面临着选择研究方向的困难

2022-03-23

TA创建的收藏夹 TA关注的收藏夹

TA关注的人