![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大模型
文章平均质量分 58
wozwdaqian
这个作者很懒,什么都没留下…
展开
-
LLaMA-Factory添加adalora
和的帮助。原创 2024-01-12 18:32:42 · 1201 阅读 · 1 评论 -
计算百川大模型的输出token
首先需要在modeling_baichuan.py的BaichuanForCausalLM类中添加get_outputs函数。然后运行下面的代码计算,注意,因为我显卡空间不够,所以是半精度运行。代码比较简单,记录一下免得以后要再copy一次。原创 2024-01-03 14:16:28 · 669 阅读 · 0 评论 -
关于chatglm3 function calling的理解
ChatGLM3-6B开源了工具调用,好奇他是怎么实现的,所以写了这个文章记录。原创 2023-12-26 18:08:28 · 2529 阅读 · 0 评论 -
gradio显示和隐藏侧边栏
另外:试了很多方法,没想到最简单的实现方法就是直接返回gr.update。可以用于第一次访问页面时控制组件的隐藏和显示。记一下防止忘记怎么实现的。原创 2023-11-06 18:16:39 · 1054 阅读 · 1 评论 -
记录微调chatglm3
用于记录chatglm3的过程,防止忘记。原创 2023-10-31 14:11:40 · 2373 阅读 · 8 评论