国内大模型使用比较记录

需求

        今天想用个大模型把我喜欢的一个句子“五眼鸡岐山鸣凤,两头蛇南阳卧龙,三脚猫渭水飞熊。”画出来,用了国内很多家大模型(甚至开了一个文心一言的会员)都没有取得令人满意的效果。我在这篇博客里记录一下各个模型的表现。

问题(测试流程)

a.请画出“五眼鸡岐山鸣凤,两头蛇南阳卧龙,三脚猫渭水飞熊。”

b.(如果无法作图或绘画错误)请解释“五眼鸡岐山鸣凤,两头蛇南阳卧龙,三脚猫渭水飞熊。”

c.(经过解释)请画出“五眼鸡岐山鸣凤,两头蛇南阳卧龙,三脚猫渭水飞熊。”

表现

 文心一言

a.无法生成

b.能够正确解释含义和粗略的寓意

c.无法生成

 通义千问

a.生成错误的图画

b.能够正确解释含义和寓意并给出准确的构图要素

c.生成错误的图画,经过多次询问,反而描述出了错误的意象

 讯飞星火

a.生成错误的图画

b.反复生成错误的图画,不进行解释

 智谱清言(ChatGLM)

a.无法生成

b.能够正确解释含义,寓意错误

c.无法生成

 腾讯混元

        免费体验了一下“混元生图”,把原始的句子放进去生成错误的图画,把通义千问中的描述放进去生成的图画还是不准确。

 华为盘古

        因为要申请,感觉太麻烦了,就不试了。

总结

        我认为通义千问的表现最好,它能准确地描述图画中的每个要素,但就是画不出来😂。似乎大模型无法理解现实中不存在的需要一点想象的事物。考虑到模型可能无法理解“五”“两”“三”这种量词指代的对象(例如把两头蛇当成两只蛇),也许需要更细致的问题,但这样用户就会觉得很麻烦,我是懒得去“调教”。

附:通义千问的回答

 想象一幅古代山水画卷,画卷上分布着三个鲜明的场景,各自对应上述比喻的意象:

  1. 五眼鸡岐山鸣凤图:画面一侧,群山环抱之中,岐山巍峨耸立,云雾缭绕。山脚下,一只奇特的五眼鸡站在岩石上,昂首啼鸣,它身上披着用彩羽拼凑的华服,试图模仿凤凰的姿态。四周的小鸟惊异地望着它,似乎在质疑这荒诞的一幕。这幅画面讽刺了那些凭借伪装和虚名占据显赫位置的人物。

  2. 两头蛇南阳卧龙景:画卷中央,一片宁静的南阳乡村,竹林幽深,溪水潺潺。在一棵古树下,看似一位沉睡的智者,身旁盘绕着一条双头蛇,蛇身缠绕成“卍”字形,象征着矛盾与不安。这位智者的形象模糊,让人难以分辨真伪,暗示那些自称智慧超群却实则言行不一的人物。

  3. 三脚猫渭水飞熊境:画卷的另一侧,渭水悠悠流过,河岸上,一只三脚猫努力站立,它的前爪勉强抓着一根竹竿,模仿着钓鱼的姿态,背后似乎有着熊的幻影,但仔细看去,那熊的形状模糊,似有若无。这幅景象中的三脚猫,竭力想展现出姜子牙般的智者风范,却因能力有限,显得滑稽而悲哀,反映了社会中某些人自我吹嘘而实际能力不足的现象。

整个画卷通过这三个并置的场景,用夸张且富有象征意义的画面,展现了作者对时代弊病的深刻洞察与讽刺,让观者在会心一笑的同时,也反思现实中的种种现象。 

  • 21
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值