Z !-CSDN博客

原创 AI学习：生成图片/图片风格重绘/背景图生成 -通义万相

根据用户输入的文字内容，生成符合语义描述的不同风格的图像，支持中英文双语输入。

2023-12-14 17:10:57 2347 1

原创 AI学习：图片对话 -通义千问VL-plus

在代码方面与普通的通义千问VL相比，只需要将。

2023-12-14 15:12:06 1382 1

原创 AI学习：图片对话 -通义千问VL

模型名模型简介qwen-vl-v1以 Qwen-7B 语言模型初始化，添加图像模型，图像输入分辨率为448的预训练模型。通义千问VL支持灵活的交互方式，包括多图、多轮问答、创作等能力的模型。

2023-12-14 14:48:21 3549 1

通义千问是阿里云自主研发的大语言模型。通义千问以用户以文本形式输入的指令（prompt）以及不定轮次的对话历史（history）作为输入，返回模型生成的回复作为输出。在这一过程中，文本将被转换为语言模型可以处理的token序列。Token是模型用来表示自然语言文本的基本单位，可以直观的理解为“字”或“词”。对于中文文本来说，1个token通常对应一个汉字；对于英文文本来说，1个token通常对应3至4个字母或1个单词。

2023-12-14 11:55:20 6339 2

原创 AI学习：语音转化 chat3.5

提供了基于的语音端点。modelinputvoicespeed默认情况下，生成 MP3 文件，还提供其他格式，如"opus"、“aac"或"flac”对于实时应用程序，tts-1模型提供了最低的延迟，质量比tts-1-hd模型低。由于音频生成的方式，tts-1在某些情况下可能生成具有比tts-1-hd更多静态的内容。在某些情况下，根据您的听音设备和个人感受，音频可能没有明显的差异。尝试不同的语音（合金、回声、寓言、缟、新星和闪烁），找到一个与您期望的语气和受众相匹配的语音。

2023-12-05 17:46:11 1649

原创 AI学习：图像生成 chat3.5

检测图片的大小和图片的格式，图片要为png格式且不能大于4MB。

2023-12-05 16:11:13 1561

原创 AI学习：文本生成 chat3.5

输出结果。

2023-12-05 10:50:54 2052

转载 PHP 8.1更新

PHP8.1 更新

2022-02-12 16:06:49 367

weixin_42954448的博客