🌐 Web LLM:在浏览器中运行大语言模型
- 利用WebGPU加速,无需服务器,直接在浏览器运行。
- 支持多种模型,如Llama 2 7B/13B等。
- 可以降低成本,增强个性化和保护隐私。
🔗 https://webllm.mlc.ai
🔗https://blink.csdn.net/details/1636867
🤖 Adept Fuyu-Heavy:多模态数字代理模型
- 世界第三大多模态模型,擅长理解用户界面。
- 可以解释和操作各种软件和应用程序的界面。
- 帮助执行任务如自动化流程、响应查询等。
🔗https://blink.csdn.net/details/1636877
🔊 SpeechGPT-Gen:跨模态对话能力的大语言模型
- 处理和生成语音数据,实现文本与语音的无缝对话。
- 包含8亿参数,有效处理语义和知觉信息。
🔗 https://arxiv.org/abs/2401.13527
🔗 https://github.com/0nutation/SpeechGPT
🔗https://blink.csdn.net/details/1636884
💡 OpenAI推出新一代嵌入模型
- 新嵌入模型:text-embedding-3-small和text-embedding-3-large。
- 新模型性能普遍优于上一代,特别是在多语言检索方面。
- GPT-4 Turbo预览版模型更新,提高代码生成等任务的完成度。
🔗https://blink.csdn.net/details/1636885
🤖全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
- 生成式人工智能发展的核心关键词是「大」。
- 34个机器人实验室共同启动了RT-X项目。
- RT-X 模型能借鉴其他机器人的经验,提高不同环境中的机器人鲁棒性。
⭐阿里云发布多模态大模型Qwen-VL-Max版本,性能比肩GPT-4V
- Qwen-VL-Max模型在视觉推理方面展现出卓越的能力。
- 在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息。
- Qwen-VL-Max在文档分析和图像文本处理方面取得显著进步
💻谷歌推出AMIE模型,用大模型为病人提供医疗咨询
- 医疗资源匮乏,患者与医生深度咨询不易。
- 谷歌推出医疗咨询大语言模型AMIE。
- AMIE在多方面优于初级保健医生。
🔗 https://arxiv.org/abs/2401.05654