- 博客(3)
- 收藏
- 关注
转载 GroupMixFormer
这里提出了一种先进的注意力机制 Group-Mix Attention(GMA)。与流行的多头自注意力相对,文本方法仅对个别token之间的关联进行建模不同,所提出的GMA利用了组聚合器同时捕捉token-to-token、token-to-group和group-to-group的关联。最后,基于GMA提出了GroupM...
2024-08-03 02:35:43 22
转载 java标点符号正则
实现Java标点符号正则表达式1. 流程步骤步骤描述1导入正则表达式包2编写正则表达式3创建Pattern对象4创建Matcher对象5使用Matcher对象匹配字符串2. 详细步骤及代码示例步骤1:导入正则表达式包登录后复制 import java.u...
2024-07-14 02:56:44 51
转载 学习大模型资源
1.问题在学习大模型的时候,需要一个大模型,我们怎么选择呢?2.选择模型2.1 openai国外的OPENAI这个我们是不能选择的,主要的原因是,我们的网络会经常访问不了,另外收费也麻烦。2.2 开源大模型现在 ollama 可以让我们方便在本地部署,我们可以使用不同的大模型,比如 使用 qwen模型,但是这里有个问题,大...
2024-07-01 02:14:54 31
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人