-Love-Coding--CSDN博客

Embedding模型，query-question的匹配分数普遍高于 query-answer的匹配分数。比如对于10个query，检索结果里，9个排第一的结果是question。Reranker模型，query-answer的匹配分数普遍高于 query-question的匹配分数。比如对于10个query，检索结果里，9个排第一的结果是answer。现在有一个的问答库，包括150个QA-pair，用10个query去同时检索问答库的300个query+answer。

2025-06-15 15:46:50 71

原创多张GPU加载大模型推理

【代码】多张GPU加载大模型推理。

2025-06-13 16:18:44 111

原创【python】regex/正则，保留英文/空格/中文/数字

【代码】【python】regex/正则，保留英文/空格/中文/数字。

2025-06-10 16:07:42 130

原创 torch 生成式模型推理加速之torch_dtype=torch.float16,

【代码】torch 生成式模型推理加速之torch_dtype=torch.float16,

2025-06-09 09:42:17 69

原创调用qwen-vl-ocr模型

【代码】调用qwen-vl-ocr模型。

2025-06-08 10:42:36 154

原创 python调用Qwen3，输出＜think＞＜/think＞

【代码】python调用Qwen3，输出＜think＞

2025-06-04 14:52:17 172

原创 BERT推理加速

ALBERT推理速度是BERT的3倍左右，

2025-06-02 22:44:48 50

原创 torch 生成式模型推理加速之early_stopping=True

就是比如生成128长度，发现生成到40，后面就都是。了，就不继续decode了。

2025-05-28 09:45:11 51

原创 torch 生成式模型推理加速之padding=True

【代码】torch 生成式模型推理加速之padding=True。

2025-05-27 16:57:29 58

原创 huggingface padding=True 训练阶段报错：expected sequence of length 24 at dim 1 (got 20)

是seq2seq任务报错的,的tokenize还是。

2025-05-27 16:38:28 68

原创 pip安装指定python目录

【代码】pip安装，指定python目录。

2025-05-26 09:30:22 187

原创 T5 预训练模型

如果只有30-40w数据，训练出来有很多语句不通的case，从零训练一个T5-Base需要200-300W+数据，可以用预训练模型解决语句不通的问题。

2025-05-22 15:03:26 78

原创 huggingface transformers 加载预训练好的模型时，只加载部分层数

【代码】huggingface transformers 加载预训练好的模型时，只加载部分层数。

2025-05-22 11:59:22 49

原创 python OpenAI调用deepseek代码

【代码】python OpenAI调用deepseek代码。

2025-05-22 09:24:38 146

原创 Multi Query Attention 代码

【代码】Multi Query Attention 代码。

2025-05-19 14:31:27 54

原创 cudnn cuda nvidia驱动匹配关系

【代码】cudnn cuda nvidia驱动匹配关系。

2025-05-15 15:19:48 145

原创 python报错，A module that was compiled using NumPy 1.x cannot be run in NumPy 2.x as it may crash

解决方法，安装1.x版本的numpy。

2025-05-11 14:23:21 662

原创 python报错，ValueError: numpy.dtype size changed, may indicate binary incompatibility.

【代码】python报错，ValueError: numpy.dtype size changed, may indicate binary incompatibility.

2025-05-11 12:15:01 316

原创 python 正则，提取括号中的内容

'（测试内容）'

2025-05-09 15:14:18 162

原创 windows远程桌面作为客户端登录另一台windows

Step-3，在界面输入IP地址，用户名，密码。Step-1，快捷键。

2025-05-08 10:36:29 137

原创 python AzureOpenAI 代码实例

【代码】AzureOpenAI 代码实例。

2025-04-30 11:40:49 151

转载 RoPE源码实现

【代码】RoPE源码实现。

2025-04-24 14:28:21 51

原创 deepspeed的PPO算法实现和代码阅读

actor_loss计算代码，可见是新logits和旧的logits的距离计算之后，乘以advantage得到最终的loss。reward计算代码，可见通过计算ref-model的输出和actor-model的输出的距离得到reward。advantage计算代码，可见advantage是next-value减去value得到的。critic_loss计算代码，可见critic的逻辑是判断新value和旧value的距离。

2025-04-23 16:00:04 259

flash-attn-2.7.4.post1+cu12torch2.4cxx11abiFALSE-cp39-cp39-linux-x86-64.whl

https://github.com/Dao-AILab/flash-attention/releases

2025-03-23

torch-2.4.1+cu124-cp39-cp39-linux-x86-64.whl

https://download.pytorch.org/whl/torch/

2025-03-23

Chinese-DeepSeek-R1-Distill-data-110k

https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k

2025-03-13

Qwen2.5-0.5B

https://huggingface.co/Qwen/Qwen2.5-0.5B

2025-03-13

torch-2.4.1+cu118-cp39-cp39-linux-x86-64.whl

https://download.pytorch.org/whl/torch/

2025-03-15

flash-attn-2.7.3+cu11torch2.4cxx11abiFALSE-cp39-cp39-linux-x86-64.whl

2024-12-14

金庸群侠传MOD大侠梦开源代码

学习游戏开发非常好的资料。游戏视频：https://space.bilibili.com/447278957

2024-11-29

曹操传MOD禾下霸业开源代码

学习游戏开发非常好的资料。游戏视频：https://space.bilibili.com/447278957

2024-11-29

depth-anything/Depth-Anything-V2-Base-hf

https://huggingface.co/depth-anything/Depth-Anything-V2-Base-hf

2024-11-08

torchvision-0.19.1+cu118-cp38-cp38-linux-x86-64.whl

更多：https://download.pytorch.org/whl/torchvision

2024-10-29

torch-2.4.1+cu118-cp38-cp38-linux-x86-64.whl

更多：https://download.pytorch.org/whl/torch/

2024-10-28

torch-2.3.1+cu118-cp38-cp38-linux-x86-64.whl

更多：https://download.pytorch.org/whl/torch/

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

flash-attn-2.7.0.post2+cu11torch2.4cxx11abiFALSE-cp38-cp38-linux-x86-64.whl

https://github.com/Dao-AILab/flash-attention/releases

2025-03-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

flash-attn-2.7.4.post1+cu12torch2.4cxx11abiFALSE-cp39-cp39-linux-x86-64.whl

torch-2.4.1+cu124-cp39-cp39-linux-x86-64.whl

Chinese-DeepSeek-R1-Distill-data-110k

Qwen2.5-0.5B

torch-2.4.1+cu118-cp39-cp39-linux-x86-64.whl

flash-attn-2.7.3+cu11torch2.4cxx11abiFALSE-cp39-cp39-linux-x86-64.whl

blender-4.3.2-linux-x64.tar.xz

blender-4.3.2-windows-x64.msi

blender-4.3.2-macos-arm64.dmg

DeepSeek系统优化总结（清华-翟季冬）

torch-1.13.1+cu117-cp38-cp38-linux-x86-64.whl

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-1/2

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-2/2

联想笔记本，win10没声音，f1长亮

金庸群侠传MOD大侠梦 开源代码

曹操传MOD禾下霸业 开源代码

depth-anything/Depth-Anything-V2-Base-hf

torchvision-0.19.1+cu118-cp38-cp38-linux-x86-64.whl

torch-2.4.1+cu118-cp38-cp38-linux-x86-64.whl

torch-2.3.1+cu118-cp38-cp38-linux-x86-64.whl

Qwen2.5-VL-7B-Instruct zip包1/7

Qwen2.5-VL-7B-Instruct zip包7/7

Qwen2.5-VL-7B-Instruct zip包6/7

Qwen2.5-VL-7B-Instruct zip包5/7

Qwen2.5-VL-7B-Instruct zip包4/7

Qwen2.5-VL-7B-Instruct zip包3/7

Qwen2.5-VL-7B-Instruct zip包2/7

deepseek-llm-7b-chat 压缩包00

deepseek-llm-7b-base 压缩包00

deepseek-llm-7b-chat 压缩包04

deepseek-llm-7b-chat 压缩包05

deepseek-llm-7b-chat 压缩包02

deepseek-llm-7b-chat 压缩包03

deepseek-llm-7b-chat 压缩包01

deepseek-llm-7b-base 压缩包01

deepseek-llm-7b-base 压缩包02

deepseek-llm-7b-base 压缩包04

deepseek-llm-7b-base 压缩包03

deepseek-llm-7b-base 压缩包05

flash-attn-2.7.0.post2+cu11torch2.4cxx11abiFALSE-cp38-cp38-linux-x86-64.whl

人工智能的因果学习（Causal Learning）到底想解决什么问题？

强化学习是不是无人驾驶的未来？

学好数学对于编程的真实增益到底是多少？

总被主管说文档写的不好怎么办？

GAN生成图像，弄一个discriminator ，和无D直接生成，区别是？

哪些互联网公司的管理职级和专业职级是分开的？

CTR模型的AUC如果比较高，是否其实只是 因为复购行为带来的AUC虚高？

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配？

BYOL里stop-gradient的作用是什么？

马上2022年了，pointer-network现在看来的作用是什么？

马上2022年了，强化学习+NLP 有了哪些突破？

每个物理公式是否都是在【描述】一个事情？

Float特征直接输入deepCTR模型和分桶转成int再embedding输入的区别是？

为什么机器翻译文本生成，至今仍然在用transformer-auto-regressive的别扭架构？

NER任务只有一个类的情况下，BME或者Yes-No的数据预处理方式对结果有影响吗？

学好数学对于编程的真实增益的性价比到底如何？

如果说每一个数学公式都在描述一件事情，那么数学公式的推导，是在做什么？

研究出 通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症 的难度排名?

求通俗讲讲数学或理论物理进行研究的细节，复杂公式是不是也都是由基础公式而来？

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度？

自动驾驶，如何得到方向盘转动的ground truth？

AlphaGo能超越人类，因为训练时 对于模型的每个输入，都有一个100%正确的答案?

其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远？

技术上，ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力？

数学 是且仅是 一种语言和一种工具，不是科学的全部？

哪些时候用CUDA编程更好？

有人搞过离线CTR模型么，缓存每个user对每个item的打分，没缓存的item默认处理，靠谱吗？

MetaLearning是LearnToLearn，那如何解决LearnToLearnToLearn？

BERT/GPT是 精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”？

用RL做NLP，和 根据那条数据的reward重新标注那条数据 有什么区别？

2022年了，USB式GPU有哪些进展？

没有物理机器人载体，如何在模拟环境里的进行学习和研究机器人？

2022年了，有哪些稳压deepfm的CTR模型？

CTR模型，如果上线了没效果，这时可以进行哪些分析工作？以及有无必要投入大量时间分析？

算法工程师如何应对做算法策略的不确定性；比如没效果，这时绩效怎么保证？

CTR模型必须要有一个测试数据集吗？ 训练数据集和测试数据集是同一个，可以吗？

因果推断技术靠谱吗，感觉里面的影响因素太多了，所以能实际解决落地问题吗？

为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具？

把user买过的item的名字embedding后作为特征，以及item本身的名字embedding作为特征，这两个特征加到CTR模型，会有效果吧？

XGB/GBDT/决策树，得出特征重要性的原理是什么？

金庸群侠传MOD大侠梦开源代码

曹操传MOD禾下霸业开源代码

CTR模型的AUC如果比较高，是否其实只是因为复购行为带来的AUC虚高？

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征最匹配？

研究出通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症的难度排名?

AlphaGo能超越人类，因为训练时对于模型的每个输入，都有一个100%正确的答案?

技术上，ChatGPT要成为 AI医生/AI律师/AI教师还欠缺哪些能力？

数学是且仅是一种语言和一种工具，不是科学的全部？

BERT/GPT是精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”？

用RL做NLP，和根据那条数据的reward重新标注那条数据有什么区别？

CTR模型必须要有一个测试数据集吗？训练数据集和测试数据集是同一个，可以吗？