大语言模型
文章平均质量分 75
ryancurry
You can do all things.
展开
-
【LLAMA3超级课堂-第四节】Llama 3 高效部署实践(LMDeploy 版)
LMDeploy 高效部署 Llama3 实践原创 2024-05-08 00:06:02 · 927 阅读 · 0 评论 -
【LLAMA3超级课堂-第二节】XTuner 微调 Llama3 个人小助手认知
XTuner 微调 Llama3 个人小助手认知原创 2024-05-07 19:09:53 · 317 阅读 · 0 评论 -
【LLAMA3超级课堂-第一节】Llama3本地Web Demo部署
Llama3本地Demo部署原创 2024-05-07 17:59:21 · 300 阅读 · 0 评论 -
利用WSL2本地部署-通义千问Qwen-7B-Chat
通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-7B的基础上,我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。本仓库为Qwen-7B-Chat的Int4量化模型的仓库。评测表现ModelMMLUC-EvalGSM8KHumanEvalCMMLU。原创 2023-09-04 15:13:50 · 3151 阅读 · 12 评论