2024 年 AI 的机会不仅在行业大模型,而且是唯一的机会。
首先通用大模型,对于普通公司来讲没有机会了。国外的 OpenAI 、谷歌、 Meta 、 Amazon 、假设还有 Microsoft 、 Nvidia 这样几个公司再加上从这几个公司出走的一些高级人材的创业公司外,别人是没有机会搞的。
国内,考虑到国内的特殊性,这个更是资源与智力的结合,极少极少的公司才有可能做成平台型的公司,尽管你可能不喜欢文心一言、通义千问、星火,或者不喜欢百川,不喜欢智谱,但是你要知道,这是一个对各方面要求都高的行业。
所以即使你拿到了基础模型,你去卷它也没有意义,很明显 AI 对于大部分人的机会就不是基础、底座、通用这些东西。
相反,随着 LLM 能力的提升,大家对于如何扩展、定制 LLM 能力的发现,可能越来越多的会在自己熟悉的行业发现更多的落地的机会,而这个落地一定是通过行业大模型来实现的。
我看好的行业大模型落地的机会
1.医疗行业(万众瞩目):
行业大模型可以在医疗行业发挥巨大作用,特别是在病例分析、研究文献的快速检索、症状对照以及个性化治疗计划的制定方面。国内的医生个体能力差异非常大,而一个经常大量病例训练的大模型,加上大量的医学知识的对齐,医疗大模型完全用临床试验数据来辅助诊断,同时为医生提供最新的研究成果和治疗方法。这样,它们可以非常有效的提高国内的误诊率,也可以很好的做医保审核,做到降本增效,除此以外的医改都是。。。;此外,它们还可以用于患者教育,通过详细与耐心的交流,可以提高患者的就医体验,提高医患间的信任感,降低医患矛盾!
2.养老情感(功德无量):
在养老服务中,大模型可以用于开发智能伴侣或情感机器人,提供日常交流、健康监测和心理支持。这些模型可以根据老年人的语言和行为反馈进行学习,从而更好地适应他们的需求和情感状态,提供个性化的互动和陪伴。这些是我们表面的期待,其实只要在情感中能夺回老年人的一部分时间,让他们保持理智,那可能大大减少针对老年人的诈骗,保健品的欺骗性售卖。功德无量!
3.外语教育(红海红海):
外语学习可以极大地受益于行业大模型的语言处理能力。技术能力更好的大模型可以用于开发个性化学习计划,根据学生的能力和进度调整教学内容。它们还可以模拟自然的语言环境,提供实时的语音识别和反馈,帮助学生改进发音和语法。但是,这是一个红海了,没有技术能力的别进。
4.K12 教育(万事不知):
在K12教育领域,这是一个可以充分释放大模型的能力的领域。大模型可以用来支持个性化学习和辅助教学。它们可以分析学生的学习习惯和理解能力,为他们推荐定制的学习材料和练习。我想国外的 可汗学院已经开始这么干了,此外 Coursea 应该也在开发。此外,大模型还可以作为智能辅导老师,提供24/7的作业帮助和学习咨询。但是,这个行业吧,有不可知的风险,所以谨慎从事。
5.会计产品:
用它是不是能解决报销难,报销慢的问题?我实在受不了了。
6.客服行业(不用则死):
行业大模型可以彻底改变客服行业,通过自然语言理解提供更精准的客户支持。它们可以处理大量的用户查询,实时提供解决方案,并持续学习以提高回答问题的能力。此外,这些模型还可以分析客户情绪,优化客户体验。我相信,不用大模型,这个行业的产品一定会死掉。
7.直播行业(你要看机器人吗?):
在直播行业,大模型可以用来分析观众的反馈,提供实时互动和内容推荐,甚至亲自上场来完成与观众的直接的视频交流。主播可以利用这些模型来优化他们的表现,根据观众的反应调整直播内容,技术能力强的还是能实时做到主播与数字人的实时切换,是不是相当相当的魔幻,一会是人一会是 AI?
随后呢,看看我想的几个方向 。
行业大模型的开发
要涉足行业大模型的开发,你一定要在自己熟悉的行业,这一点是毋庸置疑的,只有在这个行业里,你才能知道,大模型发力的点儿在那儿?比如我想了如何在下面几个方向做开发应用
-
客服流程集成:
技术方向:使用行业大模型,可以通过大模型来提升客服对话系统。例如,可以实现上下文理解、情绪识别和个性化响应生成。细节增加:模型可以嵌入现有的客服流程中,与客户的对话历史数据进行联动,从而提供更准确的回答和解决方案。此外,可以进行多轮对话管理,以维持更长时间的交互,确保问题得到彻底解决。同时模型有一定的自省能力,你部署给客户后,教会他们怎么用 Prompts,可能会大大降低你的服务成本。 -
文档和报告生成:
技术方向:定制化的大模型可以利用文本生成技术来自动化报告编写工作,包括市场分析报告、技术文档等。对于大量的办公室的员工,可能是一个强需求。但是谁给钱可能要想想,老板 要是想到自己花的钱被用来买 AI 来忽悠自己???这个场景太美好了,真是值得想像啊。但是呢大模型可以根据输入的数据和指令,很容易生成结构化和逻辑性强的文档内容。此外,可以进行个性化定制,以符合不同行业或公司的文档风格和格式要求。这个都是直接的生产力提升啊! -
数据分析和洞察:
技术方向:使用大模型进行预测分析,如销售预测、市场趋势分析等。过去的机器学习模型,如时间序列分析、分类和回归分析等,只能给你看个图,看个表,有个屁用啊。现在的大模型可以在图与表的数据基础上给你分析,给你思考无死角的结果。同时,将它集成到数据分析平台中,提供自然语言接口,那些业务大佬 也能轻松使用,你就不用了!
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。