![](https://img-blog.csdnimg.cn/2019091813595558.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
LLM
文章平均质量分 78
LLM
Cyril_KI
本科 华北电力大学-计算机科学与技术-负荷预测-联邦学习|研二 天津大学-图神经网络-舆论场-社交网络挖掘
展开
-
LLM上下文长度扩展方案:YaRN
LLM上下文长度扩展方案:YaRN原创 2024-07-14 22:57:35 · 1016 阅读 · 2 评论 -
LLM上下文长度扩展方案:NTK-aware interpolation
LLM上下文长度扩展方案:NTK-aware interpolation原创 2024-06-20 11:52:13 · 968 阅读 · 0 评论 -
LLM上下文长度扩展方案:Position Interpolation
LLM上下文长度扩展方案:Position Interpolation原创 2024-06-18 00:12:05 · 762 阅读 · 0 评论 -
Long-Context LLM综述
Long-Context LLM,长上下文大模型综述原创 2024-06-10 14:01:15 · 766 阅读 · 0 评论 -
ImportError: /usr/local/app/.local/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64
pip install flash-attn==2.5.9.post1原创 2024-06-05 10:46:10 · 455 阅读 · 0 评论 -
运行vllm报错:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper
降低tokenizers版本原创 2024-06-03 23:47:00 · 486 阅读 · 0 评论 -
详解Transformer在时序预测中的Encoder和Decoder过程:以负荷预测为例
详解Transformer在时序预测中的Encoder和Decoder过程:以负荷预测为例原创 2023-10-31 21:32:31 · 3854 阅读 · 2 评论