Deno_V
码龄6年
关注
提问 私信
  • 博客:75,602
    问答:19
    75,621
    总访问量
  • 38
    原创
  • 30,621
    排名
  • 359
    粉丝
  • 7
    铁粉
  • 学习成就

个人简介:NLP,LLM都感兴趣,我的主页是 https://deno-v.github.io !

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2019-03-27
博客简介:

weixin_44839047的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    4
    当前总分
    567
    当月
    16
个人成就
  • 获得350次点赞
  • 内容获得64次评论
  • 获得490次收藏
  • 代码片获得825次分享
创作历程
  • 10篇
    2024年
  • 7篇
    2023年
  • 11篇
    2022年
  • 11篇
    2021年
成就勋章
兴趣领域 设置
  • Python
    pythonscikit-learn
  • 人工智能
    机器学习人工智能神经网络自然语言处理
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

要不要设置tokenizer.pad_token = tokenizer.eos_token? ——对pad_token和eos_token的分析

pad_token和eos_token在训练过程和推理中扮演的角色是不同的。 如何设置pad_token。能不能让pad_token=eos_token。 tokenizer.pad_token = tokenzier.eos_token.
原创
发布博客 2024.11.08 ·
962 阅读 ·
21 点赞 ·
0 评论 ·
19 收藏

【代码记录】多线程示例代码

用多线程处理多gpu模型输入的时候写的,感觉复用性会很不错,用以记录和分享。
原创
发布博客 2024.10.03 ·
398 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

【torch报错处理】RuntimeError: probability tensor contains either `inf`, `nan` or element < 0

RuntimeError: probability tensor contains either `inf`, `nan` or element < 0 报错解决,torch版本
原创
发布博客 2024.10.03 ·
1331 阅读 ·
8 点赞 ·
0 评论 ·
11 收藏

【胡乱念叨】大模型的“我”

大模型的“我”是假我吗?大模型的自我意识,对话模型的自我意识。一些扯淡~~
原创
发布博客 2024.09.19 ·
886 阅读 ·
27 点赞 ·
0 评论 ·
21 收藏

【杂记】裂脑人实验和语言模型幻觉

发现裂脑人的实验结果和目前大模型面临的幻觉问题也高度相关,遂随笔记录。
原创
发布博客 2024.09.06 ·
872 阅读 ·
8 点赞 ·
0 评论 ·
20 收藏

【位置编码】【Positional Encoding】直观理解位置编码!把位置编码想象成秒针!

PEpos2isin100002idmodel​pos​PEpos2i1cos100002idmodel​pos​这里提供一个直观的理解方案,可以帮助你轻松理解为什么要如此编码。【转载注明出处】
原创
发布博客 2024.08.30 ·
700 阅读 ·
27 点赞 ·
0 评论 ·
13 收藏

【Hopfield 网络】 记忆和联想

Hopfield网络,因此为了在听到旋律之后快速找到对应的曲子,或者说肽链成为能量稳定的蛋白质,其过程依赖的必然不是搜索!而是一个更加自然的规律。这个规律对于肽链来说,就是根据自然物理法则的规律,不停的降低自己的能量!这个规律对于寻找曲子来说,则更为抽象一点,可以理解成对有噪声输入的还原!(1)现在听到的歌曲是一个小球,小球在一个广场(你的思维)上;(2)它在广场上的位置初始的位置就是他自身的旋律(包含你听到的外界的噪声且不完整);(3)小球不停的在重力(重力就是你的大脑的思考!
原创
发布博客 2024.08.25 ·
1148 阅读 ·
32 点赞 ·
0 评论 ·
20 收藏

[草稿]关于冲击响应,低通滤波器和高通滤波器,响应曲线和功能的直观理解

躺在床上想着想着睡着了,醒了之后随便写下了点东西。很早学过的一些知识,重温觉得有趣了起来。写的内容很乱,也没翻书核对啥,也没啥数学,就是直观的一些理解。乱七八糟的权当是起床后落笔记录一下梦中之事。
原创
发布博客 2024.08.11 ·
338 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

【Karapathy大神build-nanogpt】Take Away Notes

【代码】【Karapathy大神build-nanogpt】Take Away Notes。
原创
发布博客 2024.07.14 ·
1146 阅读 ·
26 点赞 ·
0 评论 ·
8 收藏

【NeRF和NLP】一些观察感悟,碎碎念

NeRF和自然语言大模型和幻觉的胡说八道和碎碎念
原创
发布博客 2024.02.02 ·
614 阅读 ·
8 点赞 ·
0 评论 ·
10 收藏

我自己的Mac装机软件推荐!

之前好多mac破解软件网址没了,macbl现在还活着也还用起来不错~
原创
发布博客 2023.12.31 ·
881 阅读 ·
7 点赞 ·
0 评论 ·
9 收藏

事实验证文章分类 Papers Category For Fact Checking

一些关于事实验证领域证据召回,验证推理过程的文献综合整理分类(不是很严谨)。欢迎从事事实验证Fact Checking领域的友友们前来交流,讨论。可以私信我,也可以评论我,我都会看到滴,有合作意愿的也欢迎!
原创
发布博客 2023.12.25 ·
1453 阅读 ·
27 点赞 ·
0 评论 ·
29 收藏

【Huggingface】DataCollatorForSeq2Seq中的pad_to_multiple_of选项

【Huggingface】DataCollatorForSeq2Seq中的pad_to_multiple_of选项 ### 也就是说当pad_to_multiple被设置成None以外的内容时,通常是8或者16,max_label_length会被调节成设置值的整数倍,这样做的目的是方便N卡更高效利用计算能力。
原创
发布博客 2023.10.17 ·
1011 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

【CUDA OUT OF MEMORY】【Pytorch】计算图与CUDA OOM

在实践过程中多次碰到了CUDA OOM的问题,有时候这个问题是很好解决的,有时候DEBUG一整天还是头皮发麻。最近实践对由于计算图积累导致CUDA OOM有一点新的看法,写下来记录一下。包括对计算图的一些看法和一个由于计算图引发错误的简化实例记录。
原创
发布博客 2023.09.07 ·
727 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【PyTorch distributed】多卡训练原理简析与RuntimeError: Expected to mark a variable ready only once.报错分析

当一个bucket中的所有hook都被触发,意味着这个bucket中的变量的梯度都已经计算得到,Reducer便立刻开启横跨所有进程的异步的梯度平均。此时由于不同rank的计算图不一样,没有任何一个bucket会ready,自然任何一个bucket的allreduce也不会被触发,Reducer虽然会在所有bucket变成ready后等待各自完成allreduce操作,但是当所有进程的backward()已经完成梯度的计算,Reducer将不会等待还未进入ready状态的bucket。得到不同的随机参数。
原创
发布博客 2023.05.19 ·
3729 阅读 ·
21 点赞 ·
7 评论 ·
31 收藏

Diffusion Model 扩散模型 / 一知半解版

网上很多扩散模型的理论说明了,涉及到了推倒过程和原理知识,等等。我看了一些,不论如何,我就是感觉生涩难懂,难达精髓。
原创
发布博客 2023.04.19 ·
303 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

前向网络,两层MLP,可以作为未归一化的Key-Value记忆结构

个key-value对,这个成对的kv就是记忆。每个key用一个d维的向量表示。以此分布查询key对应value的值进行聚合得到输出结果。如果去掉偏置,可以改写成。同样我们可以定义value矩阵。个key就可以构成一个参数矩阵。,我们可以轻松的计算输入向量在。传统的两层神经网络可以被写为。个keys上的分布(伪分布)
原创
发布博客 2023.02.20 ·
195 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

指派问题如何用原始对偶理论进行求解。

答:

啊,这是我一年前写的对偶问题drp解决指派的博客,我刚刚自己浏览了一遍我自己的帖子,发现我自己看不懂了,主要是我也忘了很多东西....

不过吧,我还有一点印象,首先一点是在用drp求解初始解的方法和迭代的过程,比如求解drp的结果,我的印象是这样的求解能达到优化的目的,但不一定和划线法的完全结果吻合(我只是浅浅记得一点点当时的探索,不是很确定,你可以自己试一下。
另外一点是,划线法和drp方法我只是当时觉得有内在联系,才去思考了一阵。我也不知道是不是有专业的书籍或者什么其他资料讨论这个方法,建议你权当参考。我也不是专业的从事这方面的存在。
划线法比drp方便和直观的多,当年博客的动机在于想解释为什么按照划线法的步骤操作就能最优的原因。然后发现这里可能是暗含了对偶求解的思路。
谢谢

回答问题 2022.10.03

在windows上拥有mac的键盘体验【autohotkey】

希望在windows11上有mac的键盘操作逻辑,ctrl和command操作,桌面切换
原创
发布博客 2022.08.04 ·
2625 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

Pytorch_Geometric(PyG)使用DataLoader报错RuntimeError: Sizes of tensors must match except in dimension 0.

使用Pytorch_Geometric(PyG)时构建DataLoader,从DataLoader获取样本Batch时报错:RuntimeError: Sizes of tensors must match except in dimension 0报错原因是数据对齐错误,1个batch是多个样本的集合,在样本拼接成集合时出现错误,其规律如下:如何解决:...
原创
发布博客 2022.06.23 ·
6344 阅读 ·
6 点赞 ·
10 评论 ·
9 收藏
加载更多