zhuikefeng
码龄8年
关注
提问 私信
  • 博客:191,311
    191,311
    总访问量
  • 96
    原创
  • 196,045
    排名
  • 87
    粉丝
  • 0
    铁粉

个人简介:人工智能爱好者

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2016-10-15
博客简介:

zhuikefeng的博客

查看详细资料
  • 原力等级
    当前等级
    4
    当前总分
    670
    当月
    4
个人成就
  • 获得209次点赞
  • 内容获得28次评论
  • 获得687次收藏
  • 代码片获得1,720次分享
创作历程
  • 11篇
    2024年
  • 24篇
    2023年
  • 2篇
    2022年
  • 2篇
    2021年
  • 49篇
    2020年
  • 1篇
    2019年
  • 7篇
    2018年
成就勋章
TA的专栏
  • 大模型
    3篇
  • cuda
    5篇
  • C++学习
    26篇
  • stl
    20篇
  • 工具
    26篇
  • Python学习
    11篇
  • 深度学习
    10篇
  • 源码解析
    7篇
  • 论文解读
    3篇
  • 经验总结
    4篇
创作活动更多

开源数据库 KWDB 社区征文大赛,赢取千元创作基金!

提交参赛作品,有机会冲刺至高2000元的创作基金,快来参与吧!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

tensorrt-llm知识

【代码】tensorrt-llm知识。
原创
发布博客 2024.07.19 ·
359 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Linux安装gpu驱动

下载完rpm之后,运行下面的命令。,选择机器的配置和环境。
原创
发布博客 2024.06.03 ·
596 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

git知识

【代码】git知识。
原创
发布博客 2024.04.08 ·
335 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

numpy知识

【代码】numpy知识。
原创
发布博客 2024.04.03 ·
360 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

pandas知识

【代码】pandas知识。
原创
发布博客 2024.04.03 ·
281 阅读 ·
4 点赞 ·
0 评论 ·
3 收藏

esp8266调试记录

使用笔记本电脑的USB接口为NodeMCU开发板供电,你需要确保电压和电流在安全范围内。虽然NodeMCU的输入输出电压限制为3.3V,但是大多数开发板都内置了电压调节器,可以从5V的USB电源降压到3.3V。因此,通常情况下,可以直接使用笔记本电脑的USB接口为NodeMCU开发板供电。
原创
发布博客 2024.03.17 ·
504 阅读 ·
10 点赞 ·
0 评论 ·
5 收藏

Docker知识

【代码】Docker知识。
原创
发布博客 2024.03.11 ·
402 阅读 ·
8 点赞 ·
0 评论 ·
9 收藏

torch.compile用法

torch.compile 通过 JIT 将 PyTorch 代码编译成优化的内核,使 PyTorch 代码运行得更快。加速主要来自减少了 Python 开销和 GPU 读/写,因此观察到的加速可能因模型架构和批量大小等因素而异。例如,如果一个模型的架构很简单并且数据量很大,那么瓶颈将是 GPU 计算并且观察到的加速可能不那么显着。要求torch>2.0,还需要安装torchtriton。
原创
发布博客 2024.02.21 ·
3746 阅读 ·
12 点赞 ·
0 评论 ·
11 收藏

深度学习知识

在 While 处判断需要继续生成,在 Attention 中计算出token对应的 CacheKV 信息存储下来,并拼接上所有的历史 CacheKV 信息进行计算,最后采样出来下一个 token。(CacheKV 实际上记录的是 Transformer 中 Attention 模块中 Key 和 Value 的值),在计算完 logits 之后会接一个Sampling 采样模块,采样出来第一个生成的 token,并将这个 token 和 CacheKV 作为 generation阶段的输入,
原创
发布博客 2024.01.26 ·
998 阅读 ·
7 点赞 ·
0 评论 ·
8 收藏

大模型学习

其中b是batch,s是序列长度,a是注意力头数,l是transformer层数,h指隐藏层维度。优化器状态占用的显存大小也是一样,与优化器类型有关,与模型参数量有关,但与输入数据的大小无关。计算量和参数量的关系,近似认为,在一次前向传递中,对于每个token,每个模型参数,需要进行2次浮点数运算,即一次乘法法运算和一次加法运算。,b是batch,l是transformer层数,h指隐藏层维度,s是输入序列长度,n是输出序列长度,4=2*2,k和v的cache,每个cache fp16存储,占用2B。
原创
发布博客 2024.01.08 ·
3799 阅读 ·
8 点赞 ·
0 评论 ·
12 收藏

Linux知识

【代码】Linux知识。
原创
发布博客 2024.01.05 ·
1305 阅读 ·
7 点赞 ·
0 评论 ·
9 收藏

python学习

【代码】python学习。
原创
发布博客 2023.12.25 ·
408 阅读 ·
7 点赞 ·
0 评论 ·
6 收藏

CMakeLists中下载github仓库代码和设置代理

在编译大型项目时,往往会遇到在CMakeLists.txt文件中下载github依赖仓库的现象。但是因为墙的原因,直接下载不了代码导致编译报错。可以通过设置代理解决。
原创
发布博客 2023.12.07 ·
2628 阅读 ·
13 点赞 ·
0 评论 ·
12 收藏

HuggingFace的transfomers库

可以通过print(enc)看到,enc是GPT2TokenizerFast类型,搜索类型的定义,在python安装包的transformers/models/gpt2/tokenization_gpt2_fast.py。我获取了opt类型的tokenizer,那么enc是什么类型呢?
原创
发布博客 2023.11.08 ·
571 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

python文档链接

python与并行计算
原创
发布博客 2023.11.02 ·
155 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

requests教程

【代码】requests教程。
原创
发布博客 2023.10.27 ·
124 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

fastapi教程

一个现代Python网络框架,可用于构建REST API。与知名的API标准完全兼容,即OpenAPI和JSON模式。FastAPI没有内置任何服务器应用程序。为了运行FastAPI应用程序,你需要一个名为的ASGI(Asynchronous Server Gateway Interface)服务器。符合 WSGI (Web Server Gateway Interface – 较早的标准)的Web服务器不适合 asyncio 应用。
原创
发布博客 2023.10.26 ·
460 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

asyncio教程

asyncio是一种使用单线程单进程的的方式实现并发的工具。asyncio提供的框架以事件循环(event loop)为中心,程序开启一个无限的循环,程序会把一些函数注册到事件循环上。当满足事件发生的时候,调用相应的协程函数。
原创
发布博客 2023.10.26 ·
1203 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

实现http流式输出的最小实践

【代码】实现http流式输出的最小实践。
原创
发布博客 2023.10.26 ·
1049 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

如何下载huggingface的模型和权重

【代码】如何下载huggingface的模型和权重。
原创
发布博客 2023.09.26 ·
3166 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多