yichudu-CSDN博客

原创常用损失函数及tf实现

交叉熵可以用来衡量两个概率分布之间的差异, 熵越小表明差异越小, 故可用作损失函数.

2019-05-07 14:32:28 2190

原创 autoResearch 官方项目复现笔记

人类不直接写 py 源代码, 而是为智能体提供一个规模不大但功能完备的语言模型训练环境，并让它在夜间自主进行实验。

2026-06-03 19:50:24 190

原创 LLM 的关键技术(模型架构, 训练与推理)

摘要： BBPE（Byte-level BPE）是一种从字节级别构建词表的分词方法，通过合并高频字节对逐步形成词表，彻底解决未登录词问题。主流大模型（如GPT、LLaMA、Qwen）均采用此方法，通过扩大词表（如Qwen词表达15万）确保中文等多语言的高效编码。BBPE初始会将汉字拆为字节，但训练中会重新合并为完整token，兼顾编码效率与字符覆盖能力。

2026-04-30 11:47:09 74

原创 nodejs 介绍

Node.js是基于Chrome V8引擎的JavaScript运行环境，使前端开发者也能编写本地程序。其特点包括非阻塞异步I/O、事件驱动、跨平台兼容性以及强大的npm生态。安装可通过官网下载Windows安装包。npm作为Node包管理器，会将安装的包存储在用户目录的AppData/Roaming/npm文件夹中。

2026-04-06 22:35:45 149

原创 OpenClaw/Hermes 等本地优先的 ai-agent 助手

AI 助理在 2025 年已经全面普及，由 ChatGPT 率先破圈引爆大众使用热潮. 它们以云端浏览器交互为主，只能接收图/文/附件, 根据用户提问给出文字回答, ai 只动嘴不动手., 是指 OpenClaw 直接接管了你的电脑, 能操作本地文件、浏览器自动化、定时任务调度、系统指令执行等.它还能接受, 即人不在家也能通过聊天软件 (飞书 / 微信 / 钉钉) 远程指挥家里电脑上的 OpenClaw.但 openClaw 背后的, 需要购买大模型服务.

2026-04-06 08:49:56 162

原创 AI编程发展史与工具(cursor, claude code, codex)介绍

AI编程正经历从辅助协同到自主代理的演进。当前阶段，AI可完成代码补全、文件生成、代码解读等任务，并逐步发展为能跨文件修改的工程级代理。未来发展方向是让AI具备AST（抽象语法树）深度理解能力，实现语义级编程推理。为突破大模型上下文限制，需要智能文件检索、渐进式上下文构建和高效压缩等技术。人类角色正从编码者转变为需求定义和结果审查者。

2026-03-29 14:17:40 236

原创数据仓库分层体系

表前缀： ods_核心职责：数据引入层，与源业务系统保持同构，完成原始数据的采集和备份。特点：数据是原始的、未经清洗的，可能存在数据质量问题。通常只做简单的字段脱敏和格式转换。

2026-03-17 16:43:47 273

原创大模型 ai 应用热门概念

摘要：大语言模型(LLM)作为对话系统核心，通过prompt生成文本回复。在此基础上，Agent赋予了LLM调用工具执行动作的能力，包含任务规划、工具调用、记忆存储和自检修正四大组件。例如面对数学计算时，Agent能像人类一样借助计算器获得精确答案，而不仅是近似回答。这种架构展现了从被动对话到主动执行的智能化演进。（99字）

2026-02-08 12:22:37 250

原创个税app数据解读

个税规则和例子解读

2026-01-16 14:36:24 188

原创 app信息流中的重排与强化学习

摘要：本文探讨了互联网推荐系统中传统top-K排序的不足，提出了三种优化策略。首先分析了多样性策略，包括MMR打散和基于DPP（行列式点过程）的算法，提供了Python实现代码示例。其次提到生成式混排方法（待补充）。最后介绍了强化学习在推荐中的应用框架，将排序视为马尔可夫决策过程，通过用户反馈优化会话级指标。这些方法旨在解决用户兴趣漂移和浏览疲劳问题，提升推荐效果。

2025-10-10 18:01:09 382

原创 sql 中的 over, group 窗口函数

SQL窗口函数摘要：作用场景：在保留原行数的同时附加计算，用于排名、累积和、环比分析等核心语法： OVER()定义计算窗口可选PARTITION BY分组（类似GROUP BY但保留所有行）可选ORDER BY定义窗口内排序典型应用：计算占比（全表为分母）生成累积值（有序累计）执行顺序：窗口函数在GROUP BY之后、SELECT之前执行特点：通过OVER()实现"行级计算"而不聚合结果，适合分析型查询

2025-09-11 15:41:24 514

原创蒸馏学习 Knowledge Distillation

本文介绍了知识蒸馏技术及其应用。知识蒸馏是一种模型压缩方法，通过让小型学生模型学习大型教师模型的输出，在保持性能的同时显著减少计算资源需求。该方法适用于将云端大模型（如ResNet-152、BERT）压缩为移动端小模型（如MobileNet、TinyBERT）。核心原理包括：利用教师模型的软标签（概率分布）传递"暗知识"；设计联合损失函数（任务损失+KL散度蒸馏损失）；特征蒸馏扩展，通过对齐中间层特征提升学习效果。该技术能有效平衡模型性能和部署效率。

2025-09-09 15:38:15 1149

原创 accelerate transformers 搭配下的 torch gpu 并行加速

自己写的 model, 在使用 transformers 框架中的 Trainer 训练时，是会默认使用 gpu 的。前提是显卡，cuda，等环境已就绪。原理是 Trainer 类中的 _move_model_to_device（）和 _prepare_input（）方法。

2025-06-05 11:43:30 518

原创互联网竞价广告基础知识

广告主, Advertiser, 付费推广自家产品.广告平台媒体, 提供广告展示的流量资源, 如app的信息流广告, 朋友圈的广告用户. 使用app中会看到广告的人.

2025-04-24 11:45:13 778

原创 transformers 预训练模型的 PreTrainedTokenizer

预训练模型用的 PreTrainedTokenizer 需要完成 truncate, [pad] 以便保证 batch 内的序列长度统一. 还需要搭配相应的 attention mask 来标记 pad 的位置, 以便在计算自注意力时忽略填充部分，避免引入噪声信息。它不再属于 hugging-face 出品的独立 tokenizer 库, 而是归属于 transformers 库, 位于。

2024-12-18 15:22:33 568

原创 torch 内置 attention (sdpa) 实现

transformer 架构的 qkv-attention 太流行了, 以至于 torch 官方直接给出了 C 实现, 位于 torch._C._nn.py, 性能更高.

2024-12-16 15:13:29 1184

原创 GPT 1到5代及chat系列的演进笔记

gppt1 发表于 2018.02, 比 bert(发布于 2018.10) 早了半年.

2024-12-03 15:09:23 1248

原创 STARnak, LTR 模型笔记

未完成.

2024-10-12 11:36:13 1035

原创 app信息流中的混排与流控

待完成.

2024-05-15 11:38:12 653

原创 LLM 幻觉现象及 RAG 解决方案

RAG（检索增强生成）结合了外部知识检索与大语言模型生成能力，有效解决LLM的幻觉、知识局限性等问题。当用户提问时，系统先检索相关文档片段作为上下文输入LLM，再生成回答，适用于客服、法律咨询等场景。典型流程包括：提问→向量检索→拼接Prompt（指令+上下文+问题）→LLM生成回答。这种方法既保留了LLM的表达能力，又通过外部知识增强了回答的准确性，未来可与Agent结合实现更智能的AI助理。

2024-01-03 11:10:56 1237

原创 py 变量的作用域

方法内部定义的变量.

2023-09-05 14:36:39 528

原创 GPT-2 笔记及简明源码

open ai 出品, 与 google 的 bert 系列是不同的任务, NLGeneration vs. NLUnderstanding.

2023-08-28 11:43:10 2327

原创 tensorflow 中的 gradient 与 optimizer

Optimizer.`minimize`(self, loss, global_step=None, var_list=None, ...)返回一个 train_op, 运用优化方法求损失函数的极小值. 它其实是以下两个 api(梯度计算与参数更新) 的封装. 当我们想在二者之间做一些自定义操作时, 就可以显式地分开调用

2023-07-12 15:29:20 1956

原创 pytorch 中的数据集与多进程并发

需要 Dataset + collate_fn + Sampler + DataLoader 联用, 才等价于 tf 的 dataset.

2023-06-20 14:58:53 2423 1

原创 train loop in transformers for torch

工作较为琐碎. 我用 train loop 统一代指, 因为主流程在内, 是一个 loop.transformers 是一个流行的预训练模型库, 我想学习并复用它的 train loop 设计.

2023-05-29 11:45:27 2757

原创 LoRA, 替代 fine-tune 的轻量级低秩分解

LoRA, Low-Rank Adaptation of Large Language Models, 大语言模型的低秩适配器. 这里的秩就是通用的最大线性无关组个数这样的定义.适用场景: 用 Lora 来替代大模型的常规 fine-tune.

2023-05-15 16:12:24 2514 2

原创使用 JPype 实现 python 调用 java

jpype

2023-05-08 20:02:12 1164

原创 AIGC 文生图及 stable diffusion webui 练习笔记

第一步, 拉git仓库第二部, 进入项目目录, 运行 webui.bat (linux 为 webui.sh). 它会安装 venv 虚拟环境, 还会试运行。

2023-04-28 18:30:13 1275

原创 LLM 中的 prompt 工程

NLP 中, 一种用于 Language Model 的 Pretrained Task 范式.前辈的特点是让模型通过去适配这些任务. 流程是 “pre-train, fine-tune, and predict”.而 prompt 的思路则与此相反, 调整预训练任务的形式(Reformulate), 使其更接近于原始预训练任务(如完形填空). 流程是 “pre-train, prompt, and predict”.

2023-02-16 11:09:18 1463

原创 ctr 校准纠偏, 保序回归

模型预测的 ctr 并不一定总是准的, 若只关注 auc 指标, 难以反映业务价值.

2023-02-07 19:41:05 2013

原创公务员考试要求及流程梳理

以我所在的浙江为例, 网址见参考[1].公务员考试录用入口.公务员公开遴选入口. 报考对象是基层公务员群体, 通俗理解就是从公务员队伍中，继续再晋升报考更好单位的公务员.公开选调入口. 报考对象是应届大学本科毕业生，他们的身份还不是公务员。而且选调生入职后更多扎根基层，作为党政机关重点培养的干部后备人选。

2022-12-15 20:43:23 1926

原创 python profile 性能分析

自己写了一个小型项目, 写完发现运行一次要好几秒, 瓶颈在哪呢?有无优化空间?涉及到的对象比较多, 方法间的嵌套和递归调用也不少, 很难手工打印时间戳去分析耗时. 此时就需要专业工具啦.

2022-11-24 16:11:05 1621

原创 py 排列组合相关工具包

用到 python 工具包来计算排列与组合

2022-10-17 20:16:06 874

原创电脑重装与手机换机的工作备忘

新电脑到手或重装后, 需要准备的环境清单.

2022-10-17 11:28:43 654

原创 pytorch autograd 自动微分与梯度更新

pytorch 内置了常见 tensor 操作的求导解析解. 从 loss 到 parameter 是若干个 op 叠加起来的复合函数, 所以用链式法则逐个计算.tensor.grad_fn 记录了一个 tensor 是由何种运算产出的, 以及相应的求导解析解.

2022-09-20 17:55:22 1494

原创互联网产品的用户调研

NPS, Net Promoter Score, 净推荐值 (或净宣传分数).

2022-08-17 11:09:37 557

原创 py 用 playwright 做 web自动化测试

web 自动化测试, 是指用运行代码的方式, 在浏览器中完成对网页的指定的操作, 解放双手与眼睛.

2022-08-12 17:36:27 1913

原创 py 周期及定时任务

python 中的周期任务与定时任务. 可以指定到具体时刻的那种哦

2022-07-27 10:46:11 533

原创 volvo s60 T4 2021款使用手册

图: 千斤顶位置图：千斤顶头部为圆形凸块图: 左前轮的位置标示, 整体图图: 左前轮的位置标示, 局部特写图图: 底部视角, 圆孔可对应千斤顶的凸起, 是受力的地方官方手册中有两处是错误的.见下图.图. 手册中的错误1为:千斤顶的头部为圆形凸块而非凹槽; 错误二为底盘样式不符且支点是圆孔而图中描述的红色条块.......

2022-06-25 15:26:50 1372

原创统计图表之桑基图 sankey diagram

一种展现能量流动的图表. 典型场景有:网上搜, 大多是付费软件的引流, 博主良心整理出无套路的即用即走在线工具.参考[1]的界面参考[2]的界面

2022-06-23 11:13:07 1002

DirectSound开发手册

DirectX，（Direct eXtension，简称DX）是由微软公司创建的多媒体编程接口。由C++编程语言实现，遵循COM。被广泛使用于Microsoft Windows。这里是directx 开发实用技巧。

2013-02-01

JEB(android apk 逆向)

JEB，apk逆向神器。整合jython与swt library，可直接运行于win64环境。

2016-02-02

JEB.android_apk_decompiler.zip

JEB，apk逆向工具神器。整合swt-library与jython。直接可以运行。

2016-02-02

apktool_2.0.0rc4.suit.zip

用于将apk逆向为目录，内含字节码文件。 version:2.0.0rc4 使用方法：内含readMe。

2016-02-02

win7防音量过大自干预程序_ vs2010完整解决方案.zip

　　Windows是一个多任务操作环境，在同一时刻允许多个应用程序共同输出自己的声音。在这多个程序中，一旦任一进程的音量失常就会严重影响用户的听觉体验。该项目通过Direct X编程在对声卡缓冲区进行音频数据捕获后进行语音信号短时域分析，然后通过Core Audio API进行音量上的实时干预，防止音量大幅突变从而破坏用户本已舒适的听觉体验。 2 项目实现 2.1录音部分 2.1.1枚举录音设备 2.1.2创建设备对象 2.1.3创建录音buffer 2.2波形分析 2.3声音干预

2013-09-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人