阿里 Qwen2-Audio 是 Qwen-Audio 的下一代版本。这个新版本能够接受音频和文本输入,并生成文本输出,可以在Qwen2-Audio Collections下载模型和试用演示。
主要特性如下:
- 语音聊天:使用语音直接向模型发出指令,而无需自动语音识别(ASR)模块。
- 音频分析:支持分析包括语音、声音、音乐等在内的音频信息,并结合文本指令进行处理。
- 多语言支持:支持超过 8 种语言/方言,例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。
阿里 Qwen2-Audio 是 Qwen-Audio 的下一代版本。这个新版本能够接受音频和文本输入,并生成文本输出,可以在Qwen2-Audio Collections下载模型和试用演示。
主要特性如下: