Dify 1.4.0 多模态来了,所想即所得
🚀Dify v1.4.0 两个新功能:
🌙 黑暗模式
推出了主题切换器,可以轻松切换亮色和暗色模式,非常适合深夜编程。点击头像体验!
🖼️ 多模态 LLM 输出
支持多模态输出,允许 LLM 在 LLMNode 中同时处理文本和图像。
两个案例如下
多模态工作流示例
名称:多模态助手
整体工作流:1.开始 – 2.LLM节点(选gemini-2.0-flash-exp
)-- 3.结束
功能:开启”文件上传“,支持文件类型选择”图片“
注:模型只能选 gemini-2.0-flash-exp
,详见https://github.com/langgenius/dify/pull/17372
配置Gemini
大家手里如果没有gemini
的api,可以使用这个API平台Let's API
练手,支持github登录,签到有福利(但不多,仅供测试)。
https://api.aigc369.com/register?aff=5rkG
如何使用 gemini-2.0-flash-exp
1、添加令牌 API-KEY
2、在Cherry Studio
中测试 API-KEY
(这步可选)
3、在dify的模型供应商中配置 gemini-2.0-flash-exp
写在最后
可是我用dify v1.2.0,LLM选 gemini-2.0 flash exp
也能多模态输入输出呀,更新了个寂寞。。。
测试图片如下
参考:dify v1.4.0官方更新日志