随着人工智能技术的快速发展,特别是大语言模型(Large Language Models, LLM)如GPT、chatglm等崛起,传统开发者们面临着前所未有的机遇与挑战。对于许多习惯于传统编程和软件开发范式的开发者来说,进军LLM领域意味着需要做出一系列深刻的思维转变。本文将从以下几个方面探讨这些转变,帮助开发者们更好地适应并把握LLM时代的浪潮。
什么是LLM?
铺天盖地的LLM新资讯,LLM到底是什么?首先,大模型和大语言模型是两回事。我们通常说的LLM是Large Language Model。先不关心large不large,我们先了解语言模型主要能解决哪些问题?
LLM也是语言模型,他其实同样也是解决这些问题,只不过之前是一个模型解决一个问题,LLM是一个模型可以解决上面所有问题。
算法解决方案的进阶:
整个LLM发展的历程
如何使用LLM?
那我们应该使用大模型呢?不管是之前的机器学习,还是后来的深度学习模型,不管是小模型还是大模型,模型都只是一个工具。我们首先要学会的是如何使用工具。
对于这个工具的使用,我认为可以按如下流程选择使用方案
不需要每个人都要有AI知识,但是每个人都需要学习如何使用这个工具。
LLM的呈现形式就是对话,你提问,他回答。你随口一问,他随口一答,你告诉他详细的需求,他可能给出满意的回复。所以如何利用好这个工具也是一大难题。
prompt就是给AI的指令,引导模型生成响应的回答,最大化挖掘LLM的能力。
prompt工程就是开发和优化提示词,一种在大模型中使用的技巧,通过提供清晰、简洁的指令或问题,充分发挥大模型的能力,让模型更好地理解我们的需求,从而得到更好的模型输出。
吴恩达教授在提示语工程公开课中提出四大元素,两大原则:
弱化强逻辑,拥抱人性
- AI的神经网络虽非100%可控,但提示词工程的重要性与人类的沟通技巧相当。要善用AI,必须将其视为一个合作伙伴,「把 AI 当人看」,提示词工程与人类的沟通技巧别无二致,尊重其能力和局限性。优化大模型的技术思路,实则借鉴了管理学中的理念,如目标设定、过程控制、持续改进和团队协作。
- 思维链: 给人思考时间
- Few-shot: 亲身示范
- RLHF: 打绩效
- 多 Agent: 搭团队
- 自洽性: 赛马
- RAG: 速查手册
- Fine-tuning:新人培训
打破旧分工,迈向大全栈
AI 能力定律
AI 能力的上限,是使用者的判断力
用过 GitHub Copilot,就知道可以不细分前后端工种了。眼高手低的人最匹配 AGI 时代,如何提升更多专业领域的判断力,指挥 AI 执行,成为大全栈,需要了解商业、产品、市场、运营等各个方面。
认清低门槛、高天花板
LLM时代的到来,是最易入门的技术革新,几乎不需要机器学习、算法基础,一张图即可囊括全套架构。但是把效果做好非常难,因此如何合理的拆分任务流、进行细节调试,纯手艺活