这场向我们袭来的 AI 浪潮,有人欢喜有人忧,但总体上是让人们都有了危机感。
所以哪怕 AI 大模型注定只会是一场存在于科技巨头之间的战役,却依旧不影响国内一众大中小厂纷纷踏入,甚至还掀起了一股 AI 创业热潮。
国产 AI 大模型混战
国内大模型的涌现速度,比起大模型能力的涌现都“毫不逊色”。
4 月 7 日,阿里正式推出超大规模语言模型 “ 通义千问 ” 邀请用户参与测试,紧接着在 4 月 11 日的 2023 阿里云峰会上,阿里巴巴集团董事会主席兼 CEO 、阿里云智能集团 CEO 张勇称,未来阿里巴巴所有产品都将接入大模型进行全面升级。
图:2023 阿里云峰会现场
4 月 8 日,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇在演讲中透露,华为云盘古大模型未来将重点做好行业应用。
4 月 9 日,360 宣布将基于 360GPT 大模型开发人工智能产品矩阵 “ 360 智脑 ” ,并面向企业用户开放内测。
图:360 面向企业开始内测
4 月 10 日,商汤科技宣布将以 “ 大模型+大算力 ” 推进 AGI(通用人工智能)作为发展战略,并公布该战略下的 “ 日日新SenseNova ” 大模型体系,展示了 “ 日日新SenseNova ” 大模型体系下的语言大模型 “ 商量SenseChat ” 。
图:商汤大模型
随后以游戏起家的昆仑万维也加入了大模型官宣阵营,称昆仑万维和奇点智源合作自研,中国第一个真正实现智能涌现的国产大语言模型—— “ 天工 ” 3.5 将于 4 月 17 日启动邀请测试。
而这只是国内大模型混战的冰山一角。
图:截止4月12日,国产大模型的不完全统计
除去上文没提到的京东、科大讯飞、字节、腾讯等老牌互联网科技大厂外,还有以王慧文的光年之外、王小川的百川智能、李开复的 Project AI 2.0 等为代表的创业派和清华大学计算机系唐杰教授的智谱 AI 和交互式人工智能( CoAI )课题组教授朱小燕及其学生黄民烈副教授团队的聆心智能等为代表的学院派。
国内企业纷纷开卷 AI 大模型,其实大都是为了抢占本地化部署的先机。
随着 AI 的加速发展,过去几年部署的 AI 应用,在接下来几年很有可能都会被基于大模型的 AI 所替代。
这些变化在带来行业升级的同时,也会造就新的行业人才缺口。
AI 产业的人才缺口
在 ChatGPT 爆火的时候,大家最先讨论的是基于 AI 生态的应用方向 —— AIGC 。
紧接着,伴随着国内外大厂们纷纷进场 AI 大模型研发,研发所需的算力、算法、数据和作为算力基础硬件配置的 GPU ,甚至是更上游的半导体行业都开始浮出水面。
而无论是 AIGC 的发展,还是研发大模型和作为硬件存在的 GPU ,甚至是半导体行业,背后都需要程序员的加入。
想要实现 AIGC 离不开人工智能、大数据和云计算领域的发展,而这又离不开具备一定算法能力,特别是掌握各种机器学习算法和深度学习算法的程序员。
图:AIGC 背后的领域
这里说的算法包括但不限于线性回归、逻辑回归、决策树、支持向量机、神经网络、卷积神经网络、循环神经网络等。
而企业进行大模型研发,又会需要具备以下能力的程序员:
1.深度学习算法和模型设计能力:掌握深度学习算法和模型设计,包括 CNN 、 RNN 、 LSTM 、 BERT 等各种深度学习模型,以及相关的优化算法。
2.高性能计算能力:熟悉 GPU 、 TPU 等加速器的使用和优化,掌握 CUDA 、 OpenCL 、 MPI 等并行计算框架和工具,提高模型的训练速度和效率。
3.分布式计算能力:掌握分布式计算的技术和工具,能够处理大规模的数据集和模型,实现模型的分布式训练和推理,提高模型的性能和扩展性。
4.软件工程和编程能力:熟悉 Python 、 C++ 、 Java 等编程语言,掌握版本控制、测试、调试等软件工程的基本原则和技能,保证代码的质量和可维护性。
另外,对于 GPU 的研发和半导体行业来说,计算机编程也是相当重要的。
GPU 研发需要程序员掌握 GPU 的架构、硬件设计、并行计算、深度学习等相关技术,熟练使用 GPU 编程语言和开发工具,如 CUDA 、 OpenCL 、 OpenGL 等,以及熟练掌握计算机图形学和图像处理等相关知识。
在半导体行业,则会需要程序员通过编写软件来控制半导体芯片的制造和测试过程。
例如,半导体公司需要编写自动化测试程序来测试芯片的性能和可靠性,也需要编写生产控制程序来管理生产过程。
那么程序员又该如何有针对性地根据行业需求来提升个人核心能力呢?
提升个人核心能力
想要有针对性地提高个人核心能力,就得先想清楚不同行业不同方向对程序员要求的技能点背后真正的需求是什么。
无论你是选择精进并行计算、图像处理、信号处理、计算机视觉等能力,还是深度学习、自然语言处理等 AIGC 领域算法能力,亦或者是 GPU 研发和半导体行业中的芯片设计、电路设计等技能,背后都离不开对程序员算法能力的要求。
所以学好算法的基本功,是你抓住这个 AI 风口的大前提。
为了提高大家的刷题效率,我们特地准备了一份针对 AI 行业的定向刷题清单,帮助大家高效提升在 AI 方向的算法基本功。
AIGC 领域
1.机器学习
-
线性回归 :
LeetCode 1476. 子矩形查询 II
-
KNN 算法 :
LeetCode 973. 最接近原点的 K 个点
-
决策树算法 :
LeetCode 250. 统计同值子树
-
SVM 算法 :
LeetCode 1277. 统计全为 1 的正方形子矩阵
-
卷积神经网络 :
LeetCode 677. 键值映射循环神经网络
LeetCode 37. 解数独
2.自然语言处理
-
文本分类 :
LeetCode 1048. 最长字符串链
-
情感分析 :
LeetCode 273. 整数转换英文表示
-
机器翻译 :
LeetCode 68. 文本左右对齐
3.大数据处理
-
分布式存储 :
LeetCode 146. LRU 缓存机制
-
MapReduce :
LeetCode 147. 对链表进行插入排序
-
Spark :
LeetCode 1111. 有效括号的嵌套深度
大模型研发
-
基础算法 :
LeetCode 1. 两数之和
LeetCode 21. 合并两个有序链表
LeetCode 146. LRU 缓存机制
LeetCode 215. 数组中的第 K 个最大元素
LeetCode 347. 前 K 个高频元素
-
线性代数 :
LeetCode 1662. 检查两个字符串数组是否相等
LeetCode 1663. 具有给定数值的最小字符串
LeetCode 1664. 生成平衡数组
LeetCode 1665. 制造字母异位词的最小步骤数
-
优化算法 :
LeetCode 33. 搜索旋转排序数组
LeetCode 518. 零钱兑换 II
LeetCode 322. 零钱兑换
-
神经网络 :
LeetCode 200. 岛屿数量
LeetCode 542. 01 矩阵
LeetCode 279. 完全平方数
LeetCode 1463. 摘樱桃 II
-
分布式系统 :
LeetCode 148. 排序链表
LeetCode 160. 相交链表
LeetCode 23. 合并 K 个升序链表
LeetCode 295. 数据流的中位数
GPU 和半导体研发行业
-
并行计算 :
LeetCode 1. 两数之和
LeetCode 42. 接雨水
LeetCode 128. 最长连续序列
LeetCode 200. 岛屿数量
LeetCode 887. 鸡蛋掉落
-
图像处理 :
LeetCode 103. 二叉树的锯齿形层序遍历
LeetCode 200. 岛屿数量
LeetCode 733. 图像渲染
LeetCode 1319. 连通网络的操作次数
-
信号处理 :
LeetCode 238. 除自身以外数组的乘积
LeetCode 347. 前 K 个高频元素
LeetCode 1480. 一维数组的动态和
LeetCode 1738. 找出第 K 大的异或坐标值
-
计算机视觉 :
LeetCode 394. 字符串解码
LeetCode 621. 任务调度器
LeetCode 647. 回文子串
LeetCode 1424. 对角线遍历 II
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓
👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓