LLM
文章平均质量分 70
关于大模型的一些学习笔记
荧惑yh
这个作者很懒,什么都没留下…
展开
-
基于AutoDL部署和微调Chatglm3-6b实战
选用AutoDL平台进行部署,租用GPU型号建议选用一张4090,显存一定要选用24G的,CUDA版本尽量选最新的。完成服务器的租用和环境搭建后,选择快捷工具中的“JupyterLab”进入服务器查看。autodl-tmp文件夹为数据盘,后续将模型及模型权重下载到这个文件夹中。原创 2024-05-17 18:18:06 · 977 阅读 · 0 评论 -
LLM记录1
是否存在另外一种选择,例如大语言模型,就发挥它的“词语接龙”的语言能力,用于对指令的理解意图和生成自然语言式的结果,而其中关键的内在专业逻辑或事实,则由外部知识库来提供,不要由大语言模型来“推理”,这样就将纯专业知识交给外挂知识库来管理,大语言模型则重点提升语言相关的能力,不断增强特定的话术和表达方式。大语言模型的基础是机器学习,属于归纳法,要从海量的数据中发现规律,结果的可靠性、可解释性是它正在努力解决的问题,那么对于已经解决了这些问题的结构化的数据,如果重新混入大模型当中,则被认为是一种倒退,是损失。原创 2024-04-04 22:29:06 · 277 阅读 · 0 评论