//社区生态//
-
商汤“日日新SenseNova 4.0”大模型体系全面升级。商汤升级了商量大语言模型、秒画文生图大模型、大语言模型的数据分析版本和医疗版本「大医」等,将LLM通用能力推向多模态领域。同时,推出全球首个支持不同模态工具调用的Assistants API。
-
面壁智能开源2B多模态端侧模型。面壁智能联合清华 NLP 实验室在北京正式发布旗舰端侧大模型2B版本的“面壁 MiniCPM”,性能全面超越Mistral-7B,量化后占用内存仅2G,已在各类常见型号的手机跑通。
//多模态大模型//
-
谷歌升级Bard多模态能力并解禁生图功能。在最新版Gemini Pro的加持下,谷歌宣布Bard不仅获得推理、理解、总结、编码能力的迅速飞升,还支持230多个国家的40多种语言,同时Bard还免费集成了文生图模型Imagen 2。
-
多模态大模型OCR能力评估发布。华中科大联合华南理工和微软研究院等研究人员对多模态大模型的OCR能力进行深入研究,在多个数据集上对文字识别等五个任务上进行了广泛的实验,并发布评估基准OCRBench。
//AI安全//
-
大模型可读指纹助力参数产权保护。为保护大模型预训练得到的参数版权,上海交大联合Lumia设计了一种人类可读的大模型指纹,在不需要公开模型参数的条件下,有效识别各个大模型之间的血统关系。
//基础技术//
-
Meta第二代自研AI芯片Artemis正式投产。为减少对NVIDIA依赖,Meta正是投产第二代自研AI芯片Artemis,将用于数据中心的推理任务、生成式AI大模型Llama 3的训练及应用。
-
大模型通过对弈可实现自我进化。UCLA的华人团队提出一种全新的LLM自我对弈系统,大模型可通过自我合成数据和指令微调提升性能,效果优于用GPT-4作为专家模型指导的方法。