自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

_Hope_

有些时候也需要强打精神

  • 博客(2034)
  • 资源 (460)
  • 问答 (108)
  • 收藏
  • 关注

原创 T5 预训练模型

如果只有30-40w数据,训练出来有很多语句不通的case,从零训练一个T5-Base需要200-300W+数据,可以用预训练模型解决语句不通的问题。

2025-05-22 15:03:26 21

原创 huggingface transformers 加载预训练好的模型时,只加载部分层数

【代码】huggingface transformers 加载预训练好的模型时,只加载部分层数。

2025-05-22 11:59:22 20

原创 python OpenAI调用deepseek代码

【代码】python OpenAI调用deepseek代码。

2025-05-22 09:24:38 50

原创 Multi Query Attention 代码

【代码】Multi Query Attention 代码。

2025-05-19 14:31:27 18

原创 cudnn cuda nvidia驱动 匹配关系

【代码】cudnn cuda nvidia驱动 匹配关系。

2025-05-15 15:19:48 76

原创 python报错,A module that was compiled using NumPy 1.x cannot be run in NumPy 2.x as it may crash

解决方法,安装1.x版本的numpy。

2025-05-11 14:23:21 147

原创 python报错,ValueError: numpy.dtype size changed, may indicate binary incompatibility.

【代码】python报错,ValueError: numpy.dtype size changed, may indicate binary incompatibility.

2025-05-11 12:15:01 167

原创 python 正则,提取括号中的内容

'(测试内容)'

2025-05-09 15:14:18 81

原创 windows远程桌面 作为客户端登录 另一台windows

Step-3,在界面输入IP地址,用户名,密码。Step-1,快捷键。

2025-05-08 10:36:29 91

原创 python AzureOpenAI 代码实例

【代码】AzureOpenAI 代码实例。

2025-04-30 11:40:49 115

转载 RoPE源码实现

【代码】RoPE源码实现。

2025-04-24 14:28:21 35

原创 deepspeed的PPO算法实现和代码阅读

actor_loss计算代码,可见是新logits和旧的logits的距离计算之后,乘以advantage得到最终的loss。reward计算代码,可见通过计算ref-model的输出和actor-model的输出的距离得到reward。advantage计算代码,可见advantage是next-value减去value得到的。critic_loss计算代码,可见critic的逻辑是判断新value和旧value的距离。

2025-04-23 16:00:04 240

原创 deepspeed训练框架 入门笔记

加载模型 和 保存模型。

2025-04-23 11:49:41 154

原创 【图问答】DeepSeek-VL 论文阅读笔记

基于图片问答(Visual Question Answering,VQA)的任务。

2025-04-21 15:57:14 182 1

原创 【文生图,图问答】《Janus: Decoupling Visual Encoding》阅读笔记

对于图像理解和图像生成,之前的工作,用单一的一个visual encoder,然而对于图像理解和图像生成,所需要不同粒度的visual encoder,本文提出把visual encoder分路的方法。

2025-04-21 10:48:33 64

原创 image tokenizer 原理和代码

添加位置编码:将position encoding加到patch embedding。线性投影:通过卷积或全连接层将每个patch展平为embedding。图像分块:将输入图像划分为N×N(如16×16)的patch。

2025-04-11 10:23:38 175

转载 VLM(vision language model)模型结构代码

【代码】VLM(vision language model)模型结构代码。

2025-04-01 22:10:17 106

转载 调用Qwen进行VQA的code example

【代码】调用Qwen进行VQA的code example。

2025-04-01 22:06:22 34

转载 调用Qwen操作手机agent的code example

【代码】调用Qwen操作手机agent的code example。

2025-04-01 22:02:30 49

转载 调用Qwen进行OCR的code example

【代码】调用Qwen进行OCR的example。

2025-04-01 22:00:27 38

转载 一个LLM的chat客户端code example

【代码】一个LLM的chat客户端example。

2025-04-01 21:37:36 39

原创 分类问题,数据分布不均匀,解决方案

现在标注了10W数据,这时训练一个模型B,就可以从给10000W数据预测,用来训练一个模型A,来给10000W数据预测,从里面捞出 各类别里数据少的,作为待标注候选。比如我们要标注100W数据,

2025-03-27 22:31:51 74

原创 单GPU/单机多卡 微调deepseek-llm-7b-base

在这里下载 https://huggingface.co/deepseek-ai/deepseek-llm-7b-base。所有代码:https://github.com/guotong1988/LLM-post-training。下面的deepseek-llm-7b-base是一个文件夹。

2025-03-27 09:44:26 273

原创 python调用deepseek-llm-7b-chat输出

【代码】python调用deepseek-llm-7b-chat输出。

2025-03-27 09:38:09 131

原创 unzip报错:invalid zip file with overlapped components (possible zip bomb)

【代码】unzip报错:invalid zip file with overlapped components (possible zip bomb)

2025-03-25 15:15:49 111

原创 【bitsandbytes报错】CUDA Setup failed

不用linux自带的python。建议用conda的python,

2025-03-24 15:39:50 331

原创 两种查看CUDA版本的方式对比

命令行(这个其实可以忽略)命令行(这个是实际的)

2025-03-24 10:48:45 36

原创 pytorch适配CUDA版本

【代码】pytorch适配CUDA版本。

2025-03-24 10:01:24 234

原创 【报错】operator torchvision::nms does not exist

torch和torchvision版本不匹配。

2025-03-23 18:15:59 244

原创 pytorch,对不同样本进行Loss上的加权

【代码】pytorch对不同样本进行Loss上的加权。

2025-03-21 10:07:43 47

原创 opencv-python,把文本画在图片里

【代码】opencv-python,把文字画在图片里。

2025-03-16 20:17:14 133

原创 报错:flash_attn_2_cuda.cpython-39-x86_64-linux-gnu.so: undefined symbol

里下载相应的版本安装。

2025-03-15 19:18:44 169

原创 Mac报错 /bin/sh: wget: command not found

具体在clone https://huggingface.co/ 的资源时候报的错。

2025-03-11 10:33:03 115

原创 SQL,union之后可能的坑

【代码】union之后可能的坑。

2025-03-04 19:45:31 140

原创 DQN(Deep Q-Network)代码实现

https://github.com/pytorch/rl/tree/main/sota-implementations/dqn核心部分:

2025-02-25 11:20:05 213

转载 MLA(Multi-Head Latent Attention)代码实现

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/inference/model.py

2025-02-25 10:35:06 57

转载 MoE(Mixture-of-Experts)代码实现

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/inference/model.py

2025-02-25 10:32:12 65

原创 torchrl报错,Supported version of ‘torchrl.envs.libs.gym.GymEnv._set_gym_args‘ has not been found

【代码】Supported version of ‘torchrl.envs.libs.gym.GymEnv._set_gym_args‘ has not been found。

2025-02-24 09:32:02 117

原创 Spark计算两列的编辑距离,先collect()一个列,再broadcast的方法,加速

【代码】Spark计算两列的编辑距离,先collect()一个列,再broadcast的方法,加速。

2025-02-21 09:18:57 49

原创 SQL大坑:union会合并后去重,union all不会有distinct的结果

【代码】SQL大坑:union会合并后去重,union all不会有distinct的结果。

2025-02-20 15:57:38 152

Qwen2.5-VL-7B-Instruct zip包7/7

Qwen2.5-VL-7B-Instruct zip包7/7

2025-05-15

Qwen2.5-VL-7B-Instruct zip包6/7

Qwen2.5-VL-7B-Instruct zip包6/7

2025-05-15

Qwen2.5-VL-7B-Instruct zip包5/7

Qwen2.5-VL-7B-Instruct zip包5/7

2025-05-15

Qwen2.5-VL-7B-Instruct zip包4/7

Qwen2.5-VL-7B-Instruct zip包4/7

2025-05-15

Qwen2.5-VL-7B-Instruct zip包1/7

Qwen2.5-VL-7B-Instruct zip包1/7

2025-05-15

Qwen2.5-VL-7B-Instruct zip包3/7

Qwen2.5-VL-7B-Instruct zip包3/7

2025-05-15

Qwen2.5-VL-7B-Instruct zip包2/7

Qwen2.5-VL-7B-Instruct zip包2/7

2025-05-15

deepseek-llm-7b-chat 压缩包05

https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

2025-03-25

deepseek-llm-7b-chat 压缩包04

https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

2025-03-25

deepseek-llm-7b-chat 压缩包03

https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

2025-03-25

deepseek-llm-7b-chat 压缩包02

https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

2025-03-25

deepseek-llm-7b-chat 压缩包01

https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

2025-03-25

deepseek-llm-7b-chat 压缩包00

https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

2025-03-25

deepseek-llm-7b-base 压缩包05

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

flash-attn-2.7.0.post2+cu11torch2.4cxx11abiFALSE-cp38-cp38-linux-x86-64.whl

https://github.com/Dao-AILab/flash-attention/releases

2025-03-24

deepseek-llm-7b-base 压缩包03

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

deepseek-llm-7b-base 压缩包04

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

deepseek-llm-7b-base 压缩包02

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

deepseek-llm-7b-base 压缩包01

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

deepseek-llm-7b-base 压缩包00

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

2025-03-24

torch-2.4.1+cu124-cp39-cp39-linux-x86-64.whl

https://download.pytorch.org/whl/torch/

2025-03-23

flash-attn-2.7.4.post1+cu12torch2.4cxx11abiFALSE-cp39-cp39-linux-x86-64.whl

https://github.com/Dao-AILab/flash-attention/releases

2025-03-23

flash-attn-2.7.3+cu11torch2.4cxx11abiFALSE-cp39-cp39-linux-x86-64.whl

https://github.com/Dao-AILab/flash-attention/releases

2025-03-15

torch-2.4.1+cu118-cp39-cp39-linux-x86-64.whl

https://download.pytorch.org/whl/torch/

2025-03-15

Qwen2.5-0.5B

https://huggingface.co/Qwen/Qwen2.5-0.5B

2025-03-13

Chinese-DeepSeek-R1-Distill-data-110k

https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k

2025-03-13

blender-4.3.2-linux-x64.tar.xz

blender-4.3.2-linux-x64.tar.xz

2025-02-12

blender-4.3.2-windows-x64.msi

blender-4.3.2-windows-x64.msi

2025-02-12

blender-4.3.2-macos-arm64.dmg

blender-4.3.2-macos-arm64.dmg

2025-02-12

DeepSeek系统优化总结(清华-翟季冬)

DeepSeek系统优化总结(清华-翟季冬)

2025-02-05

torch-1.13.1+cu117-cp38-cp38-linux-x86-64.whl

torch-1.13.1+cu117-cp38-cp38-linux-x86-64.whl

2024-12-20

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-2/2

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-2/2

2024-12-19

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-1/2

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-1/2

2024-12-19

联想笔记本,win10没声音,f1长亮

下载安装这个

2024-12-14

曹操传MOD禾下霸业 开源代码

学习游戏开发非常好的资料。 游戏视频:https://space.bilibili.com/447278957

2024-11-29

金庸群侠传MOD大侠梦 开源代码

学习游戏开发非常好的资料。 游戏视频:https://space.bilibili.com/447278957

2024-11-29

depth-anything/Depth-Anything-V2-Base-hf

https://huggingface.co/depth-anything/Depth-Anything-V2-Base-hf

2024-11-08

torchvision-0.19.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torchvision

2024-10-29

torch-2.4.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torch/

2024-10-28

torch-2.3.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torch/

2024-10-28

自动驾驶,如何得到方向盘转动的ground truth?

2024-03-18

AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?

2024-01-16

其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?

2024-01-16

技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?

2024-01-11

数学 是且仅是 一种语言和一种工具,不是科学的全部?

2023-12-14

哪些时候用CUDA编程更好?

2023-12-14

MetaLearning是LearnToLearn,那如何解决LearnToLearnToLearn?

2022-05-24

BERT/GPT是 精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”?

2022-05-09

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

2022-05-07

没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?

2022-04-28

2022年了,USB式GPU有哪些进展?

2022-04-28

2022年了,有哪些稳压deepfm的CTR模型?

2022-04-01

CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?

2022-03-24

算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?

2022-03-01

CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?

2022-02-25

有人搞过离线CTR模型么,缓存每个user对每个item的打分,没缓存的item默认处理,靠谱吗?

2022-02-18

把user买过的item的名字embedding后作为特征,以及item本身的名字embedding作为特征,这两个特征加到CTR模型,会有效果吧?

2022-02-16

为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?

2022-02-16

因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?

2022-02-08

XGB/GBDT/决策树,得出特征重要性的原理是什么?

2022-02-08

强化学习是不是无人驾驶的未来?

2022-02-01

GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?

2022-02-01

哪些互联网公司的管理职级和专业职级是分开的?

2022-01-22

CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?

2022-01-17

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?

2022-01-08

人工智能的因果学习(Causal Learning)到底想解决什么问题?

2021-12-17

BYOL里stop-gradient的作用是什么?

2021-12-01

马上2022年了,强化学习+NLP 有了哪些突破?

2021-11-26

马上2022年了,pointer-network现在看来的作用是什么?

2021-11-26

总被主管说文档写的不好怎么办?

2021-11-18

NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?

2021-11-08

为什么机器翻译文本生成,至今仍然在用transformer-auto-regressive的别扭架构?

2021-11-08

Float特征直接输入deepCTR模型和分桶转成int再embedding输入的区别是?

2021-11-08

学好数学对于编程的真实增益的性价比到底如何?

2021-11-03

学好数学对于编程的真实增益到底是多少?

2021-11-03

如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?

2021-10-26

研究出 通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症 的难度排名?

2021-10-20

每个物理公式是否都是在【描述】一个事情?

2021-10-12

求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?

2021-09-14

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?

2021-08-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除