2024年5月份大模型产研关键事件_大模型本月大事-CSDN博客

本文链接：https://blog.csdn.net/kunpengtingting/article/details/139641291

5月份大模型等开源进展

关于一个端侧多模态模型，可以用来做0CR等。Mini-InternVL 1.5: A Powerful Pocket Multimodal Model with 8% Parameters for 80% Performance

关于代码大模型进展。Mistral AI发布支持80多种编程语言的模型Codestral，22B参数，32k上下文https://huggingface.co/mistralai/Codestral-22B-v0.1

关于语音专业大模型进展。ChatTTS，支持中英双语混合输出，中文支持友好，适用于多种应用场景:https://github.com/2noise/ChatTTS, https://2noise.com/

大模型用来做文件管理。LlamaFS，自动整理电脑文件，原理在于自动重命名和组织各类型文件:http://devpost.com/software/llamafs, https://github.com/iyaja/llama-fs

关于音乐领域生成大模型进展。MusicGPT，允许在任何平台上高效本地运行最新的音乐生成A1模型，如Meta的 Music模型:GitHub - gabotechs/MusicGPT: Generate music based on natural language prompts using LLMs running locally

关于大模型产业进展。Suno v3.5版本提升了音乐生成的长度至4分钟，并优化了歌曲结构cohere发布Aya 23模型，支持23种语言，支持中文，具有80亿和350亿两种参数规模https://huggingface.co/CohereForAl/aya-23-35B,https://huggingface.co/CohereForAl/aya-23-8B

关于RAG进展。QAnything1.4.1版本中，引入文档解析，可以跟进。https://github.com/netease-youdao/QAnything/releases/tag/v1.4.1

三六零宣布开源两款大模型360Zhina0-search和360Zhinao-1.8B-Reranking，两款模型聚焦于提升长文本检索效果，在RAG术的检索、排序阶段进行模型优化，并发布techreport，https://arxiv.org/abs/2405.13386.https://arxiv.org/pdf/2405.13386

基于Facebook的fasttext训练模型，提供80倍速度提升和95%准确率的语言识别工具，支持多种语言识别:https://github.com/zafercavdar/fasttext-langdetect

Mistral 7B v0.3发布。词汇表扩展到 32768 个词，支持新的 v3 Tokenizer，支持函数调用https://huggingface.co/mistralai/Mistral-7B-v0.3

OpenRLHF:一个易于使用、可扩展且高性能的RLHF框架:OpenRLHF:An Easy-to-use.Scalable and High-performance RLHFFramework，使用Ray、LM和DeepSpeed重新设计了模型的调度，集成RLHF、DP0、拒绝抽样等技术https://arxiv.org/pdf/2405.11143，代码:GitHub - OpenLLMAI/OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework (70B+ PPO Full Tuning & Iterative DPO & LoRA & Mixtral)