2023年08月_量化交易曾小健(金融号)

12月 11月 10月 08月 07月 06月 05月

原创 “伶荔”(Linly) 项目发布中文LLaMA2模型

随着大型语言模型在众多领域展现出巨大的应用潜力，基础模型也成为人们关注的焦点。近期，许多机构都推出了中文基础模型，如GLM、baichuan等，这些模型使用了大量算力构建，他们的公开也为社区研究者们提供了极大便利。同时，也有许多具有代表性的模型都主要基于英文训练（例如LLaMA-1&2、Falcon），虽然他们在英文上能力强大，但是跨语言性能较弱。

2023-08-03 13:48:20 495

这里列出的其他训练相关超参数（尤其是学习率，以及和total batch size大小相关的参数）仅供参考。请在实际使用时根据数据情况以及硬件条件进行配置。该脚本支持以下训练模式。不支持未在表格中的模式，如要修改请自行debug。其中一些参数的含义不言自明。########参数部分################启动命令########训练后的LoRA权重和配置存放。进行指令精调，默认使用单卡。，可用于后续的合并流程。

2023-08-01 22:15:31 630

34枚金币时间管理法样表1.xlsx

34枚金币时间管理法样表1.xlsx 3786小时

2023-12-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

AI生成式技术曾小健

原创 “伶荔”(Linly) 项目发布中文LLaMA2模型

原创 Llama2 指令精调脚本

34枚金币时间管理法样表1.xlsx

空空如也