计算机视觉研究院亲自体验ChatGPT的感受,太疯狂了!

关注并星标

从此不迷路

计算机视觉研究院

2c5695aa1d88265638f6feccb044f987.gif

973190a1d2c589a7db025b41b75b34fc.gif

54a27a76cb79ac65e46f074cd7a83f26.png

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

现在ChatGPT受到业内越来越多的关注,今天分享一些国内要实现该技术的难点,以及最后亲自感受体验。

一、国内有类似 ChatGPT 能力的模型吗?

  • 高质量的数据

很多人都意识到了高质量数据对AI模型的重要性,但为什么没有中文高质量数据集呢?

1)没人。但是清洗数据是费时费力的苦活累活,博士、研究员们可没有时间和耐心去做,有那个时间为什么不找个清洗好的公开数据集,调调参数,搞几个trick,刷刷SOTA,发几篇顶会来的惬意。所有数据标注清洗都交给数据标注公司,或者低年级的学生去做,他们对数据完成什么任务,数据和任务关系,怎样的数据能训练出好模型知之甚少,怎么能建设出高质量数据集呢?数据集建设必须由训练模型的研究员或者工程师亲自参与,反复迭代。大模型时代,好数据比好模型重要N个数量级。

2)没利益。做科研的等着别人公开数据集,商业化公司又不愿意烧钱去build数据集。大多数科研人员连爬虫都不愿意写,反正有那么多公开数据集等着我去刷榜呢,为什么要做数据集。辛辛苦苦爬了一些数据,标了一些数据,赶紧发个文章领域内第一个XXX数据集,然后大家写文章引用起来。高质量的数据集和质量一般的数据集有差别吗?

  • 训练大模型的能力

现在国内好多机构都在发布大模型,可真正有大模型训练经验的研究员和博士生有几个呢。Warmup到底做多久,梯度爆炸了怎么办,loss为什么不降反升,什么时候该回退到上个ckpt?给定同样的数据和网络,pretrain from scratch的时候会有各种意想不到的问题,真正能解决这些问题的人屈指可数。很多时候很多人可能都没意识到问题,或者意识到了都train了这么久了也不能从头再来就硬着头皮train完得了。OpenAI从GPT3开始在训练超大规模模型方面积累了大量的工程经验和tricks,这个是烧钱烧出来的宝贵财富。

  • 谁能(来)funding?

OpenAI很烧钱,但幸运的是他们碰到了微软。一直很好奇如果OpenAI 2019年没有转型成LP,没有微软的支持,他还能不能做出GPT3,ChatGPT和马上要来的更惊人的GPT4?传说中的2.5万张卡不是谁都能funding的。国内的微软到底是谁?政府,投资机构,BAT等互联网公司,似乎没有一个机构能和微软一样有vision和耐心。

可以预见,短期内,很多机构会做中文ChatGPT,但大概率是烧钱做了半年一年,做到了ChatGPT 80%的能力,然后找几个Case宣称自己超越了ChatGPT,一顿PR,结果留下一个没人用的模型,差距被OpenAI越拉越大。

“此乃危急存亡之秋“,对前两天看到的ChatGPT分析的一片文章里的这句话深有共鸣。但现在谁能来扛旗说leading这样的一个项目呢?

作者:黄文灏BAAI
链接:https://www.zhihu.com/question/570713548/answer/2821681810
来源:知乎

二、亲自体验

误打误撞看到一个企业开放了OpenAI的ChatGPT接口,但是使用的时候,发现中文不太适应,就直接放弃该接口产品。

e15d67ad6de984d9669e15362a8a5ee1.png

后来又发现一款比较简洁产品,就直接使用了一番:

28598a7c28d13eae5804baf386599ae1.png

然后最近比较火的是国产化,我就顺便问下这个机器人,看看他们机器人世界是怎么看这个趋势的:

d46582c2c1d11ab143177d6b02bbc0b0.png

我感觉这也是一个商机,目前已经有很多小程序开始调用ChatGPT接口,做成一个简易产品,试用后就是开始收费(收割韭菜),待技术发展更成熟,多家搜索引擎公司压力巨大,通过体验可以知道ChatGPT可以直接给你一个比较准确的答案,而不是成千上百页的推送,还有各种广告。我们要迈入下一个时代了,科技真的可以改变世界!

太疯狂了

3986825e4d70ef77119bc879c7ef28c2.png

© The Ending

转载请联系本公众号获得授权

d9705e6b6020c44e3b2b03b28cf10c19.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

7457a5bb5d904a4660e9a6576efe7247.jpeg

扫码关注

计算机视觉研究院

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

 往期推荐 

🔗

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值