- 博客(8)
- 收藏
- 关注
原创 AI学习:图片对话 -通义千问VL
模型名模型简介qwen-vl-v1以 Qwen-7B 语言模型初始化,添加图像模型,图像输入分辨率为448的预训练模型。通义千问VL支持灵活的交互方式,包括多图、多轮问答、创作等能力的模型。
2023-12-14 14:48:21 2110 1
原创 AI学习:文本对话 -通义千问
通义千问是阿里云自主研发的大语言模型。通义千问以用户以文本形式输入的指令(prompt)以及不定轮次的对话历史(history)作为输入,返回模型生成的回复作为输出。在这一过程中,文本将被转换为语言模型可以处理的token序列。Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母或1个单词。
2023-12-14 11:55:20 4565 1
原创 AI学习:语音转化 chat3.5
提供了基于的语音端点。modelinputvoicespeed默认情况下,生成 MP3 文件,还提供其他格式,如"opus"、“aac"或"flac”对于实时应用程序,tts-1模型提供了最低的延迟,质量比tts-1-hd模型低。由于音频生成的方式,tts-1在某些情况下可能生成具有比tts-1-hd更多静态的内容。在某些情况下,根据您的听音设备和个人感受,音频可能没有明显的差异。尝试不同的语音(合金、回声、寓言、缟、新星和闪烁),找到一个与您期望的语气和受众相匹配的语音。
2023-12-05 17:46:11 1398
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人