记录一下大模型的理解能力

机器人在运行中遇到小朋友干扰,随手非正式测试一下通义千问、豆包、零一万物大模型的理解能力:

1、测试方法:

    提供两张小朋友站在机器人前的图片,前后相差1秒左右。上传图片给大模型时,说明了时间。要求大模型结合两张图片,回答机器人是否受到人员干扰?

2、测试结果:

2.1、豆包回复:

     “仅根据提供的两张图片中的 “1”“#”“大”“##” 等内容,无法判断移动机器人在运输任务中是否受到人员干扰。这些内容中没有任何与人相关的信息,也没有体现出机器人运输任务受到干扰的迹象。如果想要判断机器人是否在运输任务中受到人员干扰,需要在图片中出现人员与机器人的互动画面、人员阻挡机器人路径等相关内容才可以进行判断。”

     个人评价:

      图片中没有“1”“#”“大”“##”内容,完全不知道它看到了什么,理解成了什么;

2.2、通义千问回复:

    “从这两张图片的内容来看,并不能直接得出关于机器人的结论。第一张图片展示的是一个医疗环境,第二张图片则是在一个户外场所拍摄的小孩照片。如果要判断机器人是否受到人员干扰,我们需要看到机器人本身以及它的操作环境。请提供更多有关机器人及其所在环境的信息或者相关图片以便于我给出准确的回答。”

       个人评价:

        完全瞎扯,第一张图片和第二张图片整体差不多,只是小朋友站的位置有些变化而已;

2.3、零一万物回复:

     “图片显示一个小孩站在人行道上,双手放在臀部,看起来像是在模仿机器人的动作。小孩位于人行道中央,背景是树木和建筑物。小孩的姿势和表情似乎是在故意模仿机器人的动作,这可能对机器人的导航或安全造成干扰。因此,可以推断机器人当前受到了人员干扰。”

       个人评价:

        回答正确。

2.4、总结

        非正式测试,存在不确定因素,仅供参考(图片涉及个人隐私,没有上传)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zgrobot

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值