ku_code_ku-CSDN博客

原创 Cursor奇技淫巧篇（经常更新ing）

摘要： Cursor的Agent模式可以自动编写文件，但项目中重要的.开头配置文件需开启Dotfilesprotection防止误改。Playsoundonfinish选项会在复杂任务完成时播放提示音，避免用户遗忘。快捷键CMD+T/ctrl+T支持多标签页并行处理任务，不同于“+”新建Chat会中断前一个任务。这些功能优化了开发效率和任务管理体验。

2025-05-31 15:22:45 189

原创 DARLR用于具有动态奖励的推荐系统的双智能体离线强化学习（论文大白话）

摘要：本文提出DARALR框架，将离线强化学习应用于推荐系统，解决静态奖励函数和固定不确定性惩罚的问题。传统方法依赖冻结的世界模型，导致奖励估计偏差和策略学习不准确。DARALR通过选择器智能体选取相似且多样化的参考用户，推荐器智能体聚合交互数据动态优化奖励估计，并基于统计特征调整不确定性惩罚。技术实现上，采用马尔可夫决策过程，动态更新奖励函数和惩罚系数（如(r=\tilde{r}-\lambda_UP_U)），提升稀疏数据下的推荐效果。代码和论文已开源。

2025-05-25 17:42:08 663

原创机器学习中采样哪些事

在机器学习中，处理不平衡数据集的常用方法包括过采样和欠采样。过采样通过增加少数类样本的数量来平衡数据集，而欠采样则通过减少多数类样本的数量来实现平衡。常用的过采样方法有随机过采样和SMOTE，后者通过在少数类样本之间插值生成合成样本。欠采样方法包括随机欠采样、TomekLinks和NearMiss。TomekLinks通过移除多数类中靠近少数类的边界样本来减少多数类样本，而NearMiss则基于最近邻原则，通过移除与少数类样本距离较近或最远的多数类样本来实现欠采样。这些方法各有优缺点，适用于不同的数据集和场

2025-05-15 18:08:01 402

原创 Win11 CMD 命令行闪退的解决方案

CMD的启动行为和默认设置也存储在注册表中，通过修改注册表中的相关键值，可以改变CMD的行为。但是用自带的程序去卸载的时候出现的问题，就采用手动去把conda文件夹给删了，然后重新安装在这个过程中的话，安装的时候就会报509错误。删除或清空`AutoRun`键值后，CMD在启动时就不会再尝试执行那些可能导致错误的命令。在排查的过程中发现它是最后安装anconda_powershell_prompt工具失败的，然后就排查到了启动cmd命令行的时候就闪退。这种问题通常是由Anacond的安装或卸载操作导致的。

2025-03-29 14:12:26 1104 1

原创在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证

作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在Apple Silicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。

2025-03-22 19:54:35 867

原创推理大模型（DeepSeekR1为例）在编程中有用的提示词示例

现在的大语言模型（LLM）从工作方式上看主要分为两种，非推理模型和推理模型。比如deepseek，其中的V2,V3就是非推理模型，R1就是推理模型。两者最大的区别就是推理模型可以向人类一样进行思考，具有思维链，而非推理模型就是单词接龙，一个词一个词的蹦出来，只是按照是一句话最大的概率不断生成。今天想在这里分享的是在使用推理模型辅助我们编码的时候，我们给的提示词的格式。

2025-03-16 16:39:27 523

原创机器学习基础例子篇

逻辑回归是一种用于分类问题的机器学习算法，尽管名字里有“回归”，它的主要目标是解决二分类问题（例如，预测邮件是否为垃圾邮件）。它的核心思想是利用线性回归的输出值，通过一个S型函数（Sigmoid函数），将结果映射到0到1之间，作为属于某一类别的概率。σz11e−zσz1e−z1其中，zzz是输入特征和权重的线性组合。逻辑回归的优点在于简单高效，尤其适合线性可分数据，且结果容易解释（通过权重判断特征的重要性）。但对于复杂的非线性关系，它的表现可能不足.

2025-01-03 18:15:29 1400

原创推荐系统里面的多任务学习概述

多任务学习（multi-task learning），本质上是希望使用一个模型完成多个任务的建模，在推荐系统中，多任务学习一般即指多目标学习（multi-label learning），不同目标输入相同的feature进行联合训练，是迁移学习的一种。

2024-12-10 22:24:54 1194

原创推荐系统与大模型

目前大模型在推荐系统取得巨大进展的同时也上主要一些的问题。主要有以下三点。1. Position Bias.在推荐系统的生成语言建模范式中，用户行为序列和推荐候选序列等各种信息以文本序列描述的形式输入到语言模型中，这可能会引入语言模型本身固有的一些位置偏差。2. Popularity Bias.lm的排名结果受到候选人的受欢迎程度的影响。在lm的训练语料库中，经常被广泛讨论和提到的流行项目，往往排名更高。解决这个问题具有挑战性，因为它与预先训练过的语料库的组成密切相关。

2024-11-17 20:36:03 865

原创 Windows转Mac过渡指南

之所以下载后桌面会多出如图的图标，是因为，Safari有一个功能就是下载特定类型文件后会执行特定的“打开”动作，对于 .dmg文件来说，它会自动执行“装载”的动作。意思就是，访问这个文件夹的内容，就是在访问那个被装载设备的文件。这个动作其实就是“卸载”的意思，也就是系统关闭对那个资源的访问，并断开与之连接的那个文件夹，最后也会删除那个用来装载的文件夹的。mac默认的abc输入法，在中文输入的时候感觉是不好用的，下载了其他输入法，如搜狗输入法之后，使用还是默认的abc就很难受。3.mac中最实用的快捷键。

2024-10-31 16:06:09 2132

原创 Ubuntu22.04 Docker 国内安装最靠谱教程

docker国内配置最靠谱教程

2024-10-06 09:52:00 12651 9

原创 Bert Score-文本相似性评估

Bert Score 是基于BERT模型的一种方法。它通过计算两个句子在BERT模型中的嵌入编码之间的余弦相似度来评估它们的相似度。BERTScore考虑了上下文信息和语义信息，因此能够更准确地衡量句子之间的相似度。

2024-09-27 11:06:41 1511

原创 LORA DASH -一种更高效的微调方式

大型语言模型（LLMs）通过在大规模数据集上的预训练，能够捕捉和学习丰富的语言特征和模式。目前，尽管预训练模型在诸多任务上取得了显著的成果，但它们在特定任务上的表现仍有提升空间。为了进一步提升模型的性能，研究者们通常采用微调（Fine-tuning）的方法，即在预训练的基础上，针对特定任务继续训练模型。微调过程虽然有效，但也带来了显著的资源消耗问题。尤其是对于包含数十亿甚至数千亿参数的大型模型，全参数微调需要巨大的计算资源和内存消耗。

2024-09-24 18:00:27 907

原创 OpenAI o1 System Card 中文浓缩版

o1 模型系列通过大规模强化学习进行训练，以使用思维链进行推理。这些高级推理功能为提高模型的安全性和稳健性提供了新的途径。特别是，我们的模型可以在响应可能不安全的提示时根据上下文推理我们的安全策略。这导致在某些风险基准测试上具有最先进的性能，例如生成非法建议、选择刻板的响应以及屈服于已知的越狱。在回答之前，训练模型整合一条思维链有可能带来巨大的好处，同时也会增加因智力提高而产生的潜在风险。我们的结果强调了构建稳健的对齐方法、广泛压力测试其有效性并维护细致的风险管理协议的必要性。

2024-09-14 15:31:17 773

原创 PLANSEARCH——搜索正确的思路，然后实现它！CursorAI编码能力提升的核心

这样一来，所有观察结果的集合都可以定义为深度为 1 的有向树，其中根节点为 P，并且每个 C^1_i 都有一条从 P 指向 C^1_i 的边。为了得到二阶观察，该团队的做法是在给模型的提示词中包含原始问题 P 和 C^1_i 中包含的所有观察 —— 这些观察被构造为解决 P 所必需的原始观察。为了提升多样性，对于每个生成的思路，该团队通过假设该思路是错误的来生成一个额外的思路，并要求 LLM 给出批评 / 反馈，从而将提议的思路翻倍了。这种情况下，即使模型花费更多推理时间，也难以获得更好的搜索结果。

2024-09-12 10:55:48 758

原创 Liunx 操作系统与常用指令

本文总结在Linux操作系统中常用到的操作命令以及命令的具体应用示例。

2024-09-09 09:46:06 421

原创吊打Github Colpliot! Cursor 最新AI辅助编程工具特色功能总结

本文介绍了一款名为Cursor的智能代码编辑器，它结合GPT3.5和4.0功能，帮助编程新手快速学习和提升技能。虽然起初免费，但后来因运营成本调整为部分收费。

2024-09-06 14:03:32 474

原创大模型（LLM）内部工作流程可视化

直观的了解大模型的工作原理对大模型开发十分重要，今天给大家介绍一个来自佐治亚理工学院和 IBM 的研究人员研发的一个的Transformer可视化工具。这个工具可以让我们可以全面了解变压器内部发生的情况。它专为交互式使用而设计，可以直接从我们的浏览器了解 Transformer 模型的工作原理，尤其是使用 GPT-2 模型同时还可以自定义文本来尝试，并实时观看 Transformer 的内部组件和操作协同工作以预测下一个单词。

2024-09-04 11:48:31 1450

原创 LLM训练成本计算指南（手搓版）

在大模型训练的过程中，提前预估训练所需要的训练资源是十分有必要的，基于transformer结构的语言模型这些都是可以通过计算来进行估计的。这篇bolg就是主要围绕这个问题来进行展开。

2024-08-31 11:11:51 1011

原创（最全）入门级-LLM调教指北

变换器架构是由Vaswani等人在其著名的论文《Attention Is All You Need》中引入的，我们在这里不会深入讨论架构的具体细节，因为那将涉及到讨论所有导致并促成其创建的旧技术。变换器使我们能够训练具有惊人推理能力的大型语言模型（LLMs），同时保持架构的简洁，足以让机器学习新手开始训练/尝试。对于语言建模来说，最常见的架构就是transformer架构。变换器允许我们以一种非常高效的方式处理数据，它使用注意力机制来加强模型对输入数据序列中不同部分之间关系的学习能力。

2024-08-23 23:13:34 911

原创深度学习中常用概念总结

上下文并行大小可能是指在使用特定深度学习框架时，如 Megatron-LM 中的设置，用于控制跨多个 GPU 分配模型的不同部分的方式。微批处理大小是在模型并行或流水线并行中使用的概念，指的是在每个 GPU 或每个并行阶段中处理的批次大小。张量模型并行大小是指在模型并行中，模型的张量如何分配到不同的处理器上。它影响计算资源的利用和模型训练的稳定性。在深度学习中，词大小通常指的是模型中词嵌入（Word Embedding）的维度，即表示每个词的向量的长度。步数（Steps）通常指的是训练过程中的迭代次数。

2024-08-08 18:25:32 709

原创 Ubuntu虚拟机扩容笔记（各种方法都不行版）

最近需要对ubuntu的虚拟机下面的挂载根目录上的文件系统对应的硬盘进行扩容，在虚拟机管理平台对磁盘进行扩容后，在图形界面上尝试扩容：尝试教程主要采用下面教程的第三种方法：Ubuntu22.04 Linux磁盘扩容/硬盘扩展全过程(包括踩坑过程)_ubuntu2022 扩展硬盘空间-CSDN博客ubuntu虚拟机磁盘扩容硬盘扩展。_ubuntu2022 扩展硬盘空间。

2024-07-30 16:54:21 729

原创 Nvidia GPU驱动安装报错显卡与驱动不兼容（本身兼容）

我们公司的服务器是按照硬件服务器-->PVE(虚拟化管理平台类似于Vmvare)-->虚拟机--> 显卡-->驱动-->操作系统-->软件这样搞的。所以这个问题的关键就是不在于重启虚拟机，而在于直接重启节点。也就是下面节点的chat节点，而不是102 这台机子。开机在开机日志之中显示：显卡与驱动版本不匹配。这里是由于公司本身的服务器搭建架构的问题。重启chat节点之后就可以，就可以显示显卡驱动正常了！今天写个帖子，希望可以帮到和我遇到相似问题的同学！

2024-07-27 16:10:02 1067

原创【踩坑】Docker deamon.json 文件修改之后重启不生效

最近在安装Docker，第一次尝试从官网上的教程上面安装Docker，很遗憾被墙了。下面是官网安装教程地址（避免入坑）可行的方法是在阿里的镜像源上下载，下面是经过测试可以进行安装成功的教程：Ubuntu 22.04安装Docker(最全教程，无需科学上网)_ubuntu2204安装docker-CSDN博客docker快速安装，无需科学上网_ubuntu2204安装docker。

2024-07-27 15:51:14 12790 17

原创升级Nvidia CUDA 遇到 sub-process /usr/bin/dpkg returned an error code (1)

我的主要原因是：在尝试安装 CUDA 时，包管理器发现依赖关系问题，特别是与 NVIDIA 驱动程序包有关的版本冲突。报错：sub-process /usr/bin/dpkg returned an error code (1)在自己Ubuntu22.04的服务器环境上存在cuda版本为11.5，按照官网教程升级为12.1运行安装命令。

2024-07-22 17:34:41 1117

原创 Ubuntu22.04安装NIVIDIA显卡驱动总结

但是有时候.deb可能只是一个本地仓库包，会用于添加或者更新软件的仓库信息。并不能直接安装软件。比如nvidia的驱动就是个例子。需要独立用apt install 安装。3. 在官网上确定之后，可以直接下载对应的安装包。文件后缀默认为deb格式。4.安装deb包成功之后可以使用下面命令安装nvidia驱动。1.首先在安装驱动时需要判断系统有无GPU以及GPU的型号。.deb 文件格式让软件安装和更新变得非常容易。设定软件如何运作的参数。软件运行所需的依赖项。实际运行的软件程序。

2024-07-11 14:26:14 3809

原创 Anaconda 安装与基本使用总结

最近需要在服务器上安装和使用aconada，发现之前总是在网上找教程，每次都要找，很麻烦。这次就自己写一个安装笔记。以备日后使用。

2024-07-10 23:30:00 1750

原创视觉语言模型：融合视觉与语言的未来

视觉语言模型（Vision-Language Models, VLMs）是能够同时处理和理解视觉（图像）和语言（文本）两种模态信息的人工智能模型。这种模型结合了计算机视觉和自然语言处理的技术，使得它们能够在视觉问答、图像描述生成、文本到图像搜索等复杂任务中表现出色。它是将transformer架构应用到计算机视觉领域的成功案例。具体来说就是将传统CNN中图像特征提取的全局替换为注意力机制。视觉语言模型在多个领域展示了巨大的潜力，包括图像检索、生成式AI、图像分割、医疗诊断和机器人技术。

2024-07-06 16:39:23 2575

原创垂直领域大模型微调最全指南

一年来多以来，大语言模型发展和变化越来越快，总体呈现出模型尺寸越变越大，算力需求越来越多，模型推理要求越来越高的特点。在这种背景下，现在不同的人关于垂域 LLM 出现了一些争议，一部分人认为随着大模型的能力越来越强，垂类的知识会加训融合到大模型。尤其当下，在 GPT-4o 效果一枝独秀的前提下，其他无论是通用模型，还是基于垂类模型都被 GPT-4o 吊打，一个典型的对比就是 GPT-4o 加持的Code Colpliot的代码能力一点都不逊色与Devins等智能体工程师。

2024-06-17 18:46:44 7037 1

原创 SHL逻辑测试最全攻略-复盘系列

SHL是Saville & Holdsworth Limited（现在的Cubiks）的缩写，是一家专门从事人才评估和发展的咨询公司。他们开发了各种类型的测验，包括逻辑推理测试，用于评估候选人的认知能力和思维方式。逻辑测试通常包括一系列的问题或情境，要求测试者根据已知信息推断未知情况或解决特定的问题。这些问题可能涉及数字、图形、词汇或符号等不同类型的信息，以考察测试者的推理、分析和判断能力。本人感觉是在面试过程中完全第一次接触到这种题目去作答的话难度还是很大。因此针对性的练习技巧和手感很重要。

2024-06-08 17:49:57 4056 5

原创智慧营销的未来：中国AIGC技术的演进与应用 #未来是现在的趋势#

在中国，这种技术不仅仅是一种新的内容生产方式，更是一种全新的技术革命，它降低了内容生产的门槛，提升了生产效率，使得个体和企业都能以更低的成本创造丰富多彩的内容。随着人工智能（AI）技术的蓬勃发展，尤其是在营销技术（MarTech）领域，AIGC（AI Generated Content）技术在中国市场的应用和影响日益显著。2023年，中国在AIGC的发展和应用上已经取得了显著的进步，本文将深入分析AIGC在营销领域的应用现状及其未来的发展潜力。三、AIGC技术在营销领域的具体应用。

2024-05-09 21:08:08 672 1

原创 semantic-kernel 国内代理的配置（详细教程）

Semantic Kernel 是微软提供的一个工具，旨在帮助开发者快速、轻松地将最新的大型语言模型（LLM）技术集成到应用程序中。这意味着通过使用Semantic Kernel，开发者可以在他们的应用中加入先进的人工智能和自然语言理解能力，从而增强应用的功能性。

2024-02-15 13:52:04 968

原创 Git 工具出现克隆库失败详解

错误字符串：git unable to access xxx: Encountered end of。

2023-07-13 16:56:26 3059

原创 JupyterNoteboook输入大量警告信息

有时候使用jupyter notebook输出结果时会产生大量的警告信息，导致查看最后结果很不方便就像下面这样！

2023-05-04 10:16:38 428

原创 GIT-常见错误和解决办法总结

*****************************************************************************************问题：OpenSSL SSL_read: Connection was reset, errno 10054show：解决办法：解除SSL验证，在命令行中输入：************************************************************************************

2023-05-03 22:44:05 744

原创 kaggle最全基础入门（大数据）

Kaggle是一个数据科学竞赛平台，旨在连接数据科学家和机器学习工程师，提供一个共同解决实际问题的平台。Kaggle的任务通常由公司、学术机构、政府机构等提交，这些任务涵盖了各种问题领域，例如自然语言处理、计算机视觉、数据挖掘等。竞赛参与者可以下载数据集、提交代码和模型，并与其他参赛者交流和竞争。Kaggle还提供了一系列的教程和社区资源，帮助人们学习和分享数据科学的最佳实践。

2023-04-26 22:55:43 4898

原创 NeevaAI人工智能搜索引擎来了

无跟踪。没有偏见。搜索不受企业影响-这是Neeva的标语。Neeva是一款订阅制搜索引擎，是一款很小众的的搜索引擎，由前Google高管Sridhar Ramaswamy创立。Neeva的目标是为用户提供更好的搜索体验，通过减少广告和提供更有用的搜索结果实现这一目标。NeevaAI则是Neeva推出的搜索AI助手。NeevaAI是一款基于AI技术的新型智能搜索引擎，结合了最先进的大型语言模型（LLM）和独立的搜索技术，为用户提供了一个独特而变革性的搜索体验。

2023-04-24 23:42:38 951

原创史上最详细使用copliot AI保姆级教程来了

Copilot 是一款由 OpenAI 推出的人工智能代码自动补全AI工具，它可以帮助程序员更快、更准确地编写代码。Copilot 的核心技术基于 GPT-3 模型，但是在编码方面是优于GPT-3的，它可以根据程序员输入的上下文和代码提示，自动生成符合语法和逻辑的代码片段。使用 Copilot 可以大大提高编写代码的效率和准确性，同时也可以降低编写代码的难度和工作量。Copilot 的使用非常简单，只需要在编写代码的时候输入一些关键字或者代码提示，Copilot 就可以自动为你生成符合要求的代码。

2023-04-20 13:05:33 171885 2

原创 DATABSE&MYSQL面试题汇总（2023）

数据库是一个组织数据的集合，它是现代数据应用程序的核心，为应用程序提供了一种有效地存储和访问数据的方式。在IT岗位的面试里数据库的有些问题是不必可少会问到的，最近上网找了许多资料，发现很杂乱。于是就想总结一下最近这段时找的资料，形成一个系统化的数据库和MYSQl的面试题库。这篇文章主要回答比较深入又容易问道的问题。其他简单问题比如事务的四大特性这些的不做讨论。

2023-04-10 11:51:09 646

原创大数据开发需要知道的-面试（2023）

大数据体系从业务处理的角度看，可以分为一下几个层面：数据采集和存储：这个阶段主要涉及数据的采集、传输和存储。常见的数据采集方式包括：日志收集、传感器数据、社交媒体数据等。数据存储技术包括传统的关系型数据库，以及更适合大数据的 NoSQL 数据库和分布式文件系统，如MongoDB等。数据处理和分析：这个阶段主要用于对采集到的数据进行处理和分析。常见的大数据处理框架包括等。这些框架可以帮助处理大量的数据，并提供一些高级分析功能，如机器学习、图像处理、自然语言处理等。

2023-04-08 15:24:43 311

空空如也

空空如也