老万聊AI(1)—大模型下的思考
2023年初,ChatGPT席卷全球并成为流量的热点,人们开始挖掘ChatGPT的各种潜能,探讨其未来发展趋势及与人类的关系。最近一段对大模型进行关注与思考,读到《生成式人工智能》时感到大模型在不久的将来对很多行业产生革命性的冲击。读到《埃隆.马斯克传》时,拥有特斯拉(实际驾驶的视频数据)和推特(现在改名为“X”)的马斯克不知道什么时候推出他的自动驾驶与以“X”为中心可怕的生态链。在今年的第三届中国(郑州)人工智能大会上,百度、华为、科大讯飞、360、商汤等公司无一不谈“大模型”。
大模型极大地提高人工智能的研究门槛(在校的大学生怎样从事人工智能的研究)?极大地降低了人工智能的使用门槛(对大众来说可能是一个风口)?针对以上两个问题聊下自己的看法,仅供大家参考。
一、目前学生用到的邻域专用小模型
最近几年读了些与人工智能相关的论文,指导一些学生从事与人工智能相关的研究,也参加了一些研究生的毕业答辩(与IT相关的论文基本上都加上深度学习)。用到邻域专用小模型如图1所示。
图1 领域专用小模型
在大模型的背景下,学校的大部分学生不太可能直接从事大模型的开发与研究(资源与算力等限制),那么研究小模型意义在哪?在第三届中国智能大会上浙