闲话人工智能系列03:探索归来,重申理性,踏实干活

作者·夏虫

『数据虫巢』

全文1000

题图AI生成

3e09276bec20e2b53aacb9f57102b794.jpeg

 AI,又或者说大模型的应用。说一地鸡毛肯定不至于,但行业喧嚣了许久,其实真正能产生价值的,或者说形成局部行业变革的,其实还是很少很少的,最起码两三年内,还是要回归到理性,逐步的探索并与落地产生价值联动,才能持续下去。

223c84f95270281bf8ec04c187d3a1b7.png

19b4f2eb4d62c8369251ec245f83e8b0.png

01

聊在之前

我从年后开始正式的正儿八经的关注LLM,以及AI相关的东西,特别是其应用的一些落地。

在这个过程中,我是真的没有在观望,或者隔岸观火、怡然自得,了解一个事,我喜欢下场:

(1)跟身边不同的人在聊LLM的发展,应用,看法。这里头的人有做链路工具的,有参与模型开发的,有参与培训以及教培的,有业务人员,有实际的使用者。

(2)去实际的玩国内国外的不同大模型,包括不限于ChatGPT,文心一言、智普言清、通义千问、腾讯混元、Kimi等。这里的玩,是真的花时间去用,去尝试不同的场景,而不是走马观花,特别是其中有部分,用了很长一段时间。

(3)付费到了朋友的大模型应用社群中(主要是利用AI写作方向的),深潜其中,看看普通人对于这种事的看法和他们落地执行之后的收益效果。

(4)自己的团队参与其中,不过领域就比较固定了,不一定是LLM语言模型了,而是偏向于更实操和能直接看见的跨境电商图文领域,这个稍后再说。

说这么多,其实我想表达的是,接下来我想说的一些观点也好,结论也好,不论对错,或许本身就没有对错,起码是有一定的观察,亲身参与,甚至是贴身感受之后的一些想法吧。

3aa275d9d267ed6eef9fe4a41d8790f7.png

bd8f792f4936740041ad81898c1425de.png

02

先聊聊卖课的话题

先别误会,我不卖课,也不要找我买课,反倒是我自己为了了解其中的“奥妙”,花了几十块钱潜入社群中,只是想了解这个生态的变化和普通人对于LLM的看法,以及LLM一些应用对于普通人的一些实际影响。

当然,社群本身就是朋友的,为了了解其中的过程,不好意思白嫖人家,朋友圈二维码转了入场费,表示学习学习。

他们的方向是,利用已有的一些大模型Agent能力,进行公众号文章快速创作,然后变成流量主,接腾讯的广告,从而形成赚钱闭环。当然,这个过程,我那朋友说实在真的算实诚了,实操指导,Prompt建议,操作教程啥的,他们收费也不贵(再次申明,我不推销)。利用AI提升了生产效率之后,就可以从以前单篇难产模式,变更为流水线式批发生产--以量取胜。

跳过这趴,我们直接说结果,在群里我基本不说话就是看、听。我进去的时候,社群100多号人,前一段时间,500人的群已经满了,估计只能看后面的群了。参与其中的绝大部分人都是普通人,各行各业都有,期待在AI横行的时代,利用AI能力提升自己的一些额外能力,发掘自己的增长第二曲线。

表象结论就是,普通人的市场确实很火爆,李N舟事件不是没有道理的,有点超乎我的想象。

聊数据结论,有没有人赚到钱?真的有,但从人群规模的转化率来说,但是真的不多,并且我个人认为这逻辑ROI偏低。并且我能精准的预估,未来这种逻辑的ROI可能会更低。

先说赚到钱的那部分人的情况。我那朋友是真能赚到钱(业余搞,月入能搞个几千,非常佩服他们的落地执行力,你看能赚到钱的总是有过人之处的,并非是个人拿着工具就能赚钱的),但是不稳定,其他零散的一些玩家也有,但也不稳定。

首先从内容的生产角度来说,LLM辅助生成的内容质量与人工介入的成本是呈正相关的,所以以量取胜,本质上还是得看文的质量。那么为何现在还是有不少流量能接上广告呢?

跟以下几个因素有关。

第一,腾讯的公众号其实正在从过去私域关注的逻辑往内容分发的方式转(就是以前纯靠关注关系分发内容,现在系统也会推荐内容,并且弱化关注才能看的逻辑),这其实是鼓励内容加大生产的。所以,以量取胜,在这个阶段还是有点用的,因为腾讯需要做内容分发,就需要比之前更多的内容,这个时候内容质量是可以打折的。

第二,系统的风控,以及内容质量的评分逻辑,还没有完全适应AI大量注水的阶段。但这个能力迭代是很快的,内容同质化,内容套路化(目前让AI不套路真的很难)。作为算法出身的选手,可以负责任的告诉你,只要平台认真去搞,太容易识别了(所以,现在是平台高抬贵手的时期而已)。

作为拥有六七年文字输出经验的选手,对于内容的把控其实还是有一定发言权的(包括我自己,也是腾讯这边洗稿评判的审稿人之一,免费苦力)。想要好的内容,并且基业长青的内容,要么写作者天赋异禀快速输出,要么真的是需要时间和精力的。

总之,我自己不是特别看好这个赛道,或者说目前这种玩法吧。

cc299cceb04b71910bfa19beeebb05d7.png

ef2619ca2ffa2c978f2d7f7db00213fe.png

03

再聊聊我自己的探索

之前,在《闲话人工智能系列02:AI大胸弟帮我写了13000多字的魔幻图文小说》中,有聊到我的一些探索和琢磨。

关于在设计领域的一些观点就不聊了,还是聊自己的探索结论吧。

我尝试过以下几个方向:

(1)为一些文配插画。

(2)以文生图,再结合图生视频,尝试去制作一些动画(这块小红书很多,不少还是蛮惊艳的)。

(3)构思一个系列,用AI画图来呈现主题,再加剪辑工具拼接视频,做短视频。

(4)以文生小说,上面那个就是一次尝试

先说,不好的东西。首先写小说,我是真的基于智普言清与Kimi交叉使用,并且列大纲,想尽办法设计Prompt。你还别说,真的给我整出一万多字的奇幻小说。

但是...这个过程是真的累,并且出来的东西并没有太多惊喜,如果不是控着大纲,他的情节早就飞了,并且逻辑乱七八糟。我曾经历了让某个Agent跟着大纲,并且章节不断地“教育”他怎么改,然后写完了,又拿着完整的章节丢给Kimi,做一些补充优化。

好吧,有点为难他们了。最终出来的东西,反正我是有点不满意的,关键是中间成本太高,还不如我自己写(诶,现在我是真的自己写,哈哈,后话)。

此路不通!

以文生图,然后图生视频,再加一些剪辑技术,做成短视频。我大概勉强做了2个不到15秒的短视频,逻辑是走通了,但是图生视频有点费钱,并且感觉很不稳定。在这里,我就要对小红书上一些使用AI制作特效短视频(其中有个 西游系列,很惊艳)问下,他们怎么有些可以做的特效效果那么的好。

但实际上,那些很多也是工作室出来的,不定有多少人工多少智能,之前有问过,制作一个30秒内的视频,需要经历无数次的失败(费钱,生成一次扣点),并且需要有一定的分镜呀,特效逻辑的专业知识,并且真的费时间(30秒,需要一天时间搞定)。

当然,跟以往制作特效动画的时间比,确实已经大大缩短了,但效果层面的角度来说,可能我这种外行看着还蛮不错的,不过也能找到一些硬伤点,以及特效不稳定的地方。总感觉,还是辅助为主,人工做了很多事。

但不管怎么说,对于这条路来说,最起码普通人来说,此路不通。对于一些特效工作室的来说,可能能起到一些辅助作用,比如生成一些素材之类的,但这样岂不是又回到了我文2所说的,本质上还是Dirty的活,人少不了。

第三个尝试。人负责构思系列主题,然后AI负责画插画,中间夹杂一些故事逻辑,最终加剪辑特效和音效,变成一个半流水线生产的短视频。

73351370ca54cd5d5bdc65e735d523d5.jpeg

比如这是用AI图我复刻庄周《逍遥游》中的大椿一幅图。

07ca99475d4b6c0d5d3737e27023a8b0.jpeg

这是陶渊明的《桃花源记》中的其中一幅图。

7dccc35f5ca3e4f2bd056be230e70de0.jpeg

还有用画来画李白的诗等主题。

其实一些插图着实让我惊艳,并且低成本大概在视频号上试了小二十个视频吧,逐步摸索了一些规律的时候,视频号的流量分发再也不给我流量了,目测大概是检测到我的套路逻辑了。

遂,卒。

我终止了视频号的更新,因为本质上就是测试一条通路通不通而已,无所谓可惜不可惜。

b942f92056f501753b1ddc8238ba4cf3.png

呜呜~~ 其实还是有点点可惜的,哈哈,有几个视频我都做到了点赞数1500+了,留言600+,目测观看量10万+了。

a3f466335fae83f3285171767783ffc6.png

但终究被视频号的算法判了“死刑”,后续测试的视频很难再有流量,并且是断崖式的下跌。

此路不通。

本质上还是,怎么轻易得来的还是轻易丢掉,倒也没什么太难以接受的。核心还是说,这种流水线式的生产逻辑,被他们风控认为是生产了太多垃圾内容了(他们算法要拯救那些被我迷惑的人,哈哈,关键账号状态是正常的,这就让老夫很难搞了)。

不过经历了这个探索,我又掌握了一门“奇淫技巧”,视频剪辑技术。现在的我,看到小红书也好,视频号也好,抖音也好。一些视频解说视频,一些搞笑视频,一眼就知道怎么搞了,花点时间找素材我也可以很轻易的搞出来,只不过这个赛道太卷了。罢了罢了,老夫还是不要跟他们抢饭吃了。

已经卒了三个了。最后一个其实是我最早尝试的,插画。

这条路,我反倒是觉得能走的通的。因为大部分时候所谓的内容对应的插画,本身就是仁者见仁智者见智的东西,并且需要一定的想象力。AI画图的本身不约束性质,以及一些天马行空的不可控性,不是正好吗。

包括上面主题视频中用到的一些图,比如那副“大椿”,着实震惊到了我,我都没想过如此构图。还有那副蜀道难,以及其他李白诗句的一些插图构建,真的是可用的。

f76a79bbd6c850cdc21d4964964fbcb6.jpeg

总之,几个尝试下来,最终发现只有最小的插画领域勉强可用之,并且普通人玩起来好像也没什么门槛问题,但逻辑上赚不了钱(不够妈妈再也不用担心我的题图怎么来了)。

整个测试基本上告一段落,包括AI写小说的失败等,或许我能创作一个另一个小说逻辑体系,文不够,图来凑的图文小说模式(喜欢奇幻的,可以看看,一方面是持续的探索,另一方面算是给自己以前的文青梦续个章,慢慢悠悠的写下去)。

回到这里的主题,自己折腾了几遭,感觉还是很难完全放开手让AI去做一些事,就算能做一些事,本质上门槛都不高的东西。而这年头,真的不缺低质东西,缺的是精华。

这点有点绕不开去,所以,结论后面再说。我们继续聊体感。

4f710e6d9fb4d2f5587e94cb34804aec.png

d0e267f51634da0f47d55b93f7300b6a.png

04

自己团队的海出实践

上面是我自己在摸索,试图从普通人的视角去论证一些东西,不触摸一些东西就没有发言权嘛。

然后我自己的团队,其实在3月底的时候,也开始了AI用于实际工作中的探索。可能部分朋友不知道我是干啥的。

鄙人目前在一家上市电商公司打工,负责海外电商业务的整个中台建设。这是简单版的背景,背景之下,其中一项事项就是:我们很多货是从国内出去的,为了造福于广大海外人民,不得把那些商品资料变成他们能看懂的--其实就是商品图的转换、翻译这些事。

场景1,给图做中间转换处理,比如一些商品图做标准化处理,方便业务同学做进一步的处理,比如抠图。

f291ea8080fa8ce3c6acc0dc1479a421.png

2a089758121a1666ae598c20f90b9154.png

如上,其实是我们已经上线的系统能力了。将主体部分扣出来,以待后用。你看,两周上线,包括优化之后的效果。

中台团队就这点好,下面有数据组,有算法组,还有工程组,直接把这个事给快速闭环了,一点都不耽误功夫。

效果,可用率85%以上。

第二个场景,马上要上了,涂抹。

2e3cc0e443227a6753656c98f4a6bfd7.png

资料中太多中文元素了,不利于海外广大人民的使用,弄掉他,至于要不要翻译过来,我们马上就说。

第三个事,图片翻译,预计下周可以上线。

ba0e3cfc69d1a908256dff7295f34242.png

e3feeba7c7ca736800f3019e5a5fac99.png

da22cf40fdb811b79df77a9eeef90428.png

其实就是第二个事的进阶版,只不过有些场景涂掉就行,有些需要翻译一下。

b12649e9266a18f6b783c96c9af46a72.png

甚至,你看,我们都做了一个简单的图片编辑器了,省了多少设计美工的活呀(此处,美工不知道会不会打我)。

fd67bb72c011f40e3c5cf9cb4b4890f2.png

其实方案不复杂,随便调研一下就有了,以最复杂的图片翻译为例,ORC识别出来文字,并且吐出区域位置,然后调用一些开源的模型进行涂抹或者抠图,然后文字调用翻译(翻译API也好,或者Chatgpt也罢),再根据区域位置反向做个图层合并。

OCR这种烂大街的东西,Github上随便找,抠图、涂抹很多预训练好的开源模型,随便用,因为这个领域足够的成熟,很多时候真的不需要再进行模型微调,调来调去也是主区域识别。至于开源的,可以看下LAMA、DF等等,真的不少。

但实际生产中,直接硬上还是有不少问题的,但很多是可以通过工程逻辑来解决的,比如文字识别区域精准度的问题,抠图抠出来很多附带无用附加主体之类的,都是有办法解决的。这里这些老夫就不透露过多了,开源的东西可以随便说,自个厂子版权的东西可不能瞎说。

总之,我想表达的意思很简单,一些纵向的AI领域,其实很成熟了,落地难度没有想象中大,并且真的有实际应用场景的,不需要挖掘。

我想,短时间内,这些垂直的纵向领域,才是衍生价值的地方吧,而不是通用型的AI能力,越通用其实本质上是越无用,一些垂直纵向领域,是真的需要一些AI赋能的。

我们不能离题了,最起码,短时间内需要掰回来一些目光,不能矫枉过正。

217f4faef1874e46ab83bba29db39a20.png

20835d85a859a39a286be7510cba5974.png

05

我们真的需要提效吗

来,先给自己啪啪打脸一下。

虽然我们做了一些给商品转换效率提效的工具和能力,虽说抠图、图片转换的效率大大的提升,看着一幅很高端的样子,虽然我们也没有投入那么多精力去做(有点装逼的意思了,抱歉,不过真的不算太难)。

但是,这些东西真的不是业务卡点。以图片处理为例,招几个初级美工,甚至是搞设计的二流三流学校的学生,都能随便搞定,并且量大管够,人还便宜。

所以,他不是必需品,甚至不是业务卡点。包括我们启动做这个事,也是事前评估的,包括我自己也门清。简单来讲就是,如果评估下来,开发成本可控,那么我们就顺带搞了吧,少招点实习生也算为业务省点钱,稍稍提提效。

所以,这是一个锦上添花的活计。

我们沿着这个思路衍生下去。比如AI写PPT,AI写小说,AI聊天等等场景领域。想一个问题哈,提效是当前卡点吗?

其实不是的,我刚在【夏虫悟冰】这个号上,写了一篇《2024年中:世界变得更混沌,如若无法躺平,那就尽力去做人间清醒》,其中有个观点我觉得可以套在这里。

当美团不断试探骑手底线时,却发现骑手根本没有底线。可悲的不是内卷,而是在当今社会,他们根本就无从选择。说的是一亿的骑手被算法算的死死的。其实不该技术背这个锅,核心还是如我文中所说,本质是社会大部分行业不景气,而外卖和网约车行业是社会托底职业,导致了严重供过于求,平台可供分发的资源太多,而C端需求不但没增多可能还在减少,从而让分发单价直线下降。

这个时代,特别是这个年头,真的不缺门槛不高的廉价劳动力,缺的的是高端玩家。低端的人力市场本身就卷的要死,没活干了,就差一口饭钱了。AI真的要在这个时候革了他们的命吗?

并且,从供需的关系来看,当供大于求的时候,还一味儿去改革低端人效,是说不通的,市场驱动力是不大的。顺带说下,从伦理道德上来说,哈哈...

回到AI写小说的话题,我是真的懂网文圈的(混迹过龙空,一些写手群),你问问那些底层苦苦挣扎的千字20块钱的写手们,再让AI革了他们的命?

网文圈不缺普通的小说,普通的写手,价格也不贵。缺的是烟雨江南、烽火戏诸侯、当年明月这些顶尖的写手们(一不小心暴露了 网文偏好)。

再说PPT的事,你觉得你的老板需要一个连汇报PPT都自己写不好的下属吗?

所以,很多都是伪需求,甚至是YY出来的应用场景,这种场景不是说不存在,而是说驱动力有多大的问题,驱动力决定了他的实际落地的投入评估。

幸好,上面说的这些,都他丫的还不成熟。

788fb877e94cd624248c64c4abb906f5.png

557546e2c95a2a843c64445f02d4b4e6.png

06

回归理性,踏实干活

最后,声明一点,我真的不是AI反对派,相反,我是忠实簇拥者,但是一个理性的参与者和观察者。

当前阶段,我觉得整体普通大众的角度来说,稍稍有点魔怔了。而从场景的角度来说,还是需要再细细想想,并不是所有场景都适合去做AI提效改造的。

反倒是一些实际的垂直领域,看着很傻、很没有“技术含量”的领域,才是成熟可直接应用的领域。

全民LLM,不存在的。一是上面说的供需关系的问题,还有就是从等价交换原则的角度来说,简单门槛低的东西,通常不值钱,独家输出需要时间精力的才是珍品。

那么,AI怎么用?最起码不是全民AI,不存在的。还是之前说的,目前暂时还没有看到说AI会革哪个领域的命,一方面是成不成熟的问题,另一方面是需不需要痛不痛的问题。

很多东西,只有痛过了才会想办法解决。但目前来看,我看到的很多所谓的LLM的解决场景,都是YY出来的,怎么可能痛嘛。

在文1的时候,我说过一句话,感觉这里特应景,把他当牛马来使唤。不用白不用,一些场景里,让他干活输出,不行就换,主打的就是一个量大管够。

是的,干一些Dirty的活,最起码短期来看,打辅助是他的位置,不能老想着打Carry。

回归理性,踏实干活。这是我的观点,也是未来一段时间,我与AI交互的一些场景里的指导原则吧。

夏虫评说

在全民AI狂欢的时候,我整这么一出,仿佛有点不识时务。但不管怎么说,仅仅一家之言而已,我自己看到的,摸到的,听到的,感受到的,最终吐出来的话而已。

当然,最后,未来一定是AI时代的,毫无疑问,只不过他需要找到合适的切入点,以及找到真正能扎根的领域。

当然,本身模型能力的迭代上,哪怕从普通人使用的视角来看,前路还是漫漫的。但不管怎么样,用他来画插图挺好,以前夏虫我为了找题图,头发都找秃噜了。

现在,妈妈再也不用担心我没有题图用了,并且还不担心侵权。阿门,感谢那些AI大模型。


笔名“夏虫”,源自于我的另一个非技术公众号【夏虫悟冰】:以敬畏的眼光看待世界,在思考中成长自己。

当然,笔者还有另一层身份,10年互联网大数据以及算法经验,创过业,也有日均数十亿分发流量的商业化广告经验,专注于搜推广以及企业数据化、智能化建设,目前在一家还算行的上市电商公司做海外业务,负责中台能力建设,目前更多关注点在国际化电商的大数据、搜推以及商品、运营、人中台等底层能力的建设。

与不同的人交流,才有会进步。三人行则必有我师,最近开始关注AI以及大模型相关的话题,也欢迎一起交流


技术主公众号当然是【数据虫巢】,之前有整个《数据与广告系列》,目前逐步趋近于收尾,关于这个系列后续更大想法是逐步整理成更为体系的书籍,这个后面再说了。后续这个号,会逐步关注于大模型与人工智能,以及国际化业务大数据、搜推以及智能化中台建设的内容。

而非技术公众号【夏虫悟冰】,也会继续更新,关注更多非技术的输出,保持对这个世界的思考,偶尔发发文青梦。欢迎大家关注,或者推荐给朋友。技术之余,依然要有“诗与远方”,一起努力和加油。

如果你对奇幻故事感兴趣,也可以关注我的【夏虫的奇幻世界】,AI给了我灵感,图文的方式或许是另一片未来,打算用半辈子养自己的第三极爱好,持之以恒,娱乐自己,只为让自己脑海中的世界得以呈现。

9fb1350ad5e37b854050346579fe02c4.png

文章都看完了,还不点个赞来个赏~

2becbdabd79dc54dcbaa6ba80b3e9ce8.jpeg

  • 16
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值