某Chat的多模态版本出来了,有人问了什么叫多模态,多模态就是能看能听能说能画,如果说之前的聊天机器人只有大脑,现在它相当于还具备了身体,离全能人工智能已经一步之遥了。
虽然但是,现在的Chat多模态官方版还要花钱,一个月140块人民币吧也不算便宜。今天给大家介绍的,是一个免费使用的方法。但是个方法有两个先决条件,一个是得能连上谷歌(你懂的),另一个是非国区的苹果或者安卓账号。
下面以iPhone手机为例教大家怎么获取免费的多模态GPT4。我们先打开App Store,然后在对话栏敲入BING空格CHAT,点搜索,第一个出来的就是它。
在图标的右侧点击下载,下载完成以后点打开,再点击“有问题尽管问我”再点击聊天,这个按钮。如果你眼前出现“很抱歉,此内容在你的区域中不可用”的报错信息,这非常正常,毕竟某方法的IP地址会不稳定。
最好的方法呢,就是切换尝试不同的server和JIE点,实在不行就要使用Residential IP;但是记住每切换一次前一定要去“设置”这里点击“隐私”,再点击“清除浏览数据”。
然后再试成功了。成功以后的界面是这样的。记得打要开使用GPT-4旁边的这个开关按钮。
下面我们测试一下它的各种功能,先来试试这个读图功能。点击底端从右边数的第二个按钮,给它相机权限。
来试一下我自己的一个吉他效果器,很冷门的一款产品。我问他,请问最上一排从右边数第二个旋钮是干吗的,你可以看到它准确地识别出这个效果器的名字叫liverpool,并且给出详细的使用说明,如果点击它提供的链接,还能找到使用说明书,包含所有细节内容,非常厉害。给它五分!
下面试试它的画图功能:请你帮我画一个正在奔跑的村上春树。大概两分钟左右之后就可以出图了。放大看一看,不得不说这个效果有点差强人意,比之前MJ画的差多了。有小伙伴问说,这不是冯巩吗?有一说一,村上春树本人长得就有点像冯巩。更为搞笑的是必应的另一版村上春树,放大了看,十分像葛优啊。不论是葛优,还是冯巩,看来我们崇拜的村上春树先生,还真长了一张喜剧演员的脸。
之前网上曾经流传过多模态收费版分析一张包含有多个停车指示牌儿的图片,下面我们也拿同一张图来试试免费版。可以看到必应完全把图中的信息进行了详细识别,并且翻译成中文,但是他这个结论有点问题啊,它说的是不能在这儿停车,但正确答案应该是可以停车的。显然在这个复杂的图像任务中,免费版还是不能跟收费版比。而且绿色路牌的8am它给读成了下午四点,这一项我只能给它打三分。
多模态的另外一个主打功能是可以进行语音的分析与生成。其实语音分析早就可以了。但是语音生成可以吗?我问了一下啊,我说你能生成语音内容吗?他说我很抱歉,目前还不能生成。这都不行那叫什么多模态啊?我们不妨试一试到底什么情况。点击右下角按钮进行语音输入,需要交给它话筒权限。鲁迅拳打周树人。能出声哎,但是我们感觉到这个声音啊,还是不太自然,机器味儿很浓,跟宣传片里看到那个自然的的想费翔似的那个声音还不能比。所以说他还真是诚不欺我,在语音生成这方面,目前还不具备付费版的能力。
最后咱们试试它的“手绘图变精图”的能力到底如何。不得不说这个效果实在太糟糕了,话说回来,单说文字部分的内容,回答还是很精准的,确实是gpt-4的水准。
好,最后我们进行一个完整的总结啊。
也就是说,除了免费,可能只达到了官方收费版多模态的五成功力。想尝鲜的朋友可以自己试一下,否则的话,让我们安静的等待收费版的全面到来吧。