注:心得主要是文章续写、写小说和角色扮演(role play)方面的。至于联网搜索和代码能力等,由于没有足够样本的横向对比,就不细说了。
一、优点
1.无甲,即道德标准与审查不严格。目前比较火热的模型中,gpt系列和claude系列的甲最厚,gemini系列次之,而Grok3则是基本无甲。随便写两句破限就能让Grok3畅所欲言。(悲报,目前已经加了一次甲,主要针对时政和未成年审查)
2.文风模仿能力优秀。只需把你想要Grok3模仿的文章发给它,它就能十分甚至九分地还原。目前我主要尝试了以下几种:《水浒传》文风、散文和轻小说等,模仿得都很好。
3.听话,即十分遵循用户指令。
4.官网可免费使用(每2小时免费25条对话,需科学上网。后续可能会削减)。
二、缺点
一言以蔽之,严重的重复。其中又包含结构(格式)重复和内容重复。
经常玩role play的用户应该对内容重复不陌生,这是目前的主流模型的通病,随着上下文不断增多,各个模型都会出现不同程度的内容重复问题。而结构重复则是在Grok3上新出现的症状,以往的模型并无明显的结构重复。
1.结构重复,即AI在回复中总是采用相似的结构。如:
每次回复的开头和结尾基本相同。举例:某次回复以描写风景开头和结尾,且包含“空气中弥漫着xx的气息”,则之后的每次回复都是这种结构。或是:
在描写场景和事物时,总是使用相同的结构。举例:比如先描写场景背景->人物动作->A说了xx->B说了xx->再次动作描写->总结性描写,你会发现之后Grok3对于相似的场景和事物都会采用这样的结构来描写。
在几轮对话之后就会有明显的结构重复问题,比较影响体验。
2.内容重复很好理解,即AI的回复中人物动作和语言等几乎完全一致。不过Grok3在低楼层中的 内容重复并不明显,主要还是结构重复。而一旦楼层高了,内容重复就慢慢表现出来。
其实结构上的重复可以看作是一种退化的内容重复。因为结构重复时,只要在相似的结构中填入不同的动作、语言、心理等细节描写并加以不同的修饰,那么就表现为结构重复;而随着楼层增高,填入相同结构中的细节描写和修饰也趋于相似,最终几乎完全相同,则表现为内容重复。
三、解决方案
严格来说,Grok3的缺点是固有的特性,所以无法完全避免,只能扬长避短。目前我测试下来最舒服的Grok3玩法是:在预设中提示Grok3压制结构性重复(简单给出结构重复的示例,并严格要求它避免这种写法),并给出文风示例,要求它遵守文风,并在此基础上玩低楼层(差不多20-30轮回复之内)。在这种前提下使用Grok3,体验上是可以赶上巅峰claude3.5 sonnet甚至opus的。
但是目前Grok3的算力已经降低一次了,只能说早玩早享受了······