老万聊AI—大模型下的思考

老万聊AI(1)—大模型下的思考

2023年初,ChatGPT席卷全球并成为流量的热点,人们开始挖掘ChatGPT的各种潜能,探讨其未来发展趋势及与人类的关系。最近一段对大模型进行关注与思考,读到《生成式人工智能》时感到大模型在不久的将来对很多行业产生革命性的冲击。读到《埃隆.马斯克传》时,拥有特斯拉(实际驾驶的视频数据)和推特(现在改名为“X”)的马斯克不知道什么时候推出他的自动驾驶与以“X”为中心可怕的生态链。在今年的第三届中国(郑州)人工智能大会上,百度、华为、科大讯飞、360、商汤等公司无一不谈“大模型”。
大模型极大地提高人工智能的研究门槛(在校的大学生怎样从事人工智能的研究)?极大地降低了人工智能的使用门槛(对大众来说可能是一个风口)?针对以上两个问题聊下自己的看法,仅供大家参考。

一、目前学生用到的邻域专用小模型

最近几年读了些与人工智能相关的论文,指导一些学生从事与人工智能相关的研究,也参加了一些研究生的毕业答辩(与IT相关的论文基本上都加上深度学习)。用到邻域专用小模型如图1所示。

图1 领域专用小模型
在大模型的背景下,学校的大部分学生不太可能直接从事大模型的开发与研究(资源与算力等限制),那么研究小模型意义在哪?在第三届中国智能大会上浙江大学的杨易教授提出“面向垂直领域应用的大小模型协同技术”主要思想为多重知识表达理论:视觉知识、符号知识、手工算子、知识图谱、深度表征等综合应用实现数据与知识双轮驱动的感知与决策等。要从事人工智能的研究,首先要对大模型有深刻的认识(GPT相关的论文如图2所示),再结合具体的应用场景利用领域小模型及专家知识实现多重知识表达。

图2 与GPT相关的经典论文

| 1、学习领域小模型的同学,一定把图1中模型的原创文章认真读下并真正地理解(有一定的难度)!!!我敢打赌“很多学生未必真正理解”。
2、理解大模型是从事人工智能研究的基础。

3、阅读经典并真正地理解经典才是最佳的捷径!!!

二、常见的大模型及应用推广

一)常见的大模型及底层逻辑

废话少说,目前常见的大模型及公司见图3所示,用到的底层逻辑(技术)见图4所示。

图3 常见的大模型及公司
 

图4 大模型的底层逻辑

二)大模型的应用推广

基于大模型可能会让不少人失业,同时也会带来很多就业的机会。目前主要推广大模型应用的有:
1、在B站上,吴恩达推出了“使用ChatGPT/API构建系统”等课程;
2、百度计划推出“生成式人工智能工程师课程体系”(初级64课时、中级64课时、高级80课时)。
3、国内主要研发大模型的公司正在大力推广其应用。

| 1、一句话:大模型极大的提高了研发门槛,极大的降低了使用门槛。

2、做不成人工智开发的你,可以考虑从事大模型的应用(也可能是下一个风口)

** **

  • 7
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值