就在今年的五月底国际通信联盟在瑞士的日内瓦召开了一个叫做 AI for Good 的全球峰会
在会议现场,他们把一个奖项颁给了中国湖南一个名不见经传的钢铁公司
——湖南华凌湘潭钢铁公司
以表彰他们在AI领域做出的探索
说实话,在我看到这则咨询的时候,我对于这个奖项感还有些诧异
因为AI for Good 由国际通信联盟主办
会议聚集了各个领域的AI顶级大佬,并非什么野鸡论坛
这个钢铁公司到底做了什么能获此殊荣?
后来发现,另外一个和他共同获奖的中国公司,是华为
瞬间豁然开朗
奖项是表彰了华为和湖南华凌湘潭钢铁公司,共同推进落地的一个项目
这个世界上,总有某些角落,某些人,在背着我们疯狂的向着科技奔跑
所以大多数朋友的视野始终停留在所及则所见
AI+钢铁领域 钢铁大模型 已经诞生!
从去年的ChatGPT火遍全球之后,很多国内公司也紧随其后推出了各种大模型
而华为云工业大模型在观众们的印象中一直是久闻其名的状态
华为云做了气象大模型,天气预报的预测速度比传统的数值天气预报快了10000倍
华为云做了药物分子大模型,能够与药物研发专家一起快速推进抗菌药等药物的研发
但是气象和药物,离工业比起来,感觉总还是有点距离
但是目前事实已经摆在眼前,AI+工业已经诞生
试想一下,将来只要AI工程师了解了每一个行业的需求,制作出AI+行业需求
是不是就是一次新的工业革命!
这样的坚持和突破不仅仅发生在钢铁行业,比如:
工业设计大模型
在工业设计领域,华为云首创了3D Embedding 算法,彻底解决了3D一致性问题和高光顺面生成的问题,还通过独家的专利,实现了大模型和工业知识图谱的互补,让大模型自动生成的3D设计符合工业机理、设计意图的规范,又能让设计经验得到沉淀。
比如在汽车设计领域,华为的工业设计大模型可以做到秒级生成3D汽车模型
生成的3D文件,可以直接进行3D打印
建筑大模型
同样利用3D重建和视频生成技术,华为的建筑大模型可以在一张建筑意向草图和一段详细的提示词描述的情况下,生成高真是感建筑的3D模型
视频预测大模型
生成视频---预测场景---提前判断---规划行动 这几个功能意味着什么?意味着碳基生物生存的重要能力,现在已经在AI身上体现了
而现在的智能机器,只能被动响应
人工智能从数字世界走向物理世界的趋势已经浮现
今天,我将关于AI的学习路径及我所参考的资料全部免费分享出来,虽然机器冰冷,但希望在学习AI的路径上让大家感受到温暖!
学习途径
在我学习人工智能的过程中,主要有以下两个途径:
- 首先是B站。
- 第二是书籍。视频的讲解难免会不全面,很多时候我们需要翻阅书籍对知识进行查漏补缺、透彻理解。本文提及所有书籍在文末可免费获取电子版。
AI知识大纲
AI知识大体可以分为5个模块,接下来我会依次介绍每个模块的学习路径,最后给大家推荐几个我入门时做过的项目,帮助大家快速入门人工智能。
一、Python编程基础
在AI领域,目前大部分程序员都使用Python
作为第一语言。
学会上述操作后就入门了,但一定要将基础部分的内容掌握扎实。进阶操作在前期不着急学习,可以在日后使用过程中逐渐精通,比如函数式编程、多线程使用、异常处理与日志管理等等。
书籍推荐
这里给大家推荐两本学习Python
必备书籍。《Python编程》中每个知识点下都有对应示例,非常直观。入门后,《流畅的Python》可以帮你精通Python
,完成从小白到大神的进阶。
二、数学基础
很多同学看到数学就头疼,其实模型通用的基本数学原理并不难,难的公式在之后的模型中遇见时再逐个击破即可。
切记前期不要深陷到数学知识中去深挖!!
高数
首先大家不要惧怕数学。在遇到我们不会的数学公式时,我们要更多的思考这个公式能解决什么问题,而不是一直纠结公式的推导与计算。
比如梯度下降和反向传播的根本原理就是求导,全局最优解就是极值点,所以最优解一定在导数的某一个拐点处,类似的很多知识都是高中就学过的。
线代
在深度学习中,线代最重要的应用就是高维数据相乘运算,可以大大提升运算速度。
- 首先要明白矩阵各维度所代表的意义
- 其次清楚矩阵的运算规则
概率论
概率论的知识在AI体系中看似不那么重要,但却无处不在。从数据预处理、建模、模型参数初始化及归一化,到最后的结果分析都与概率论息息相关。
常用指标很多是大家耳熟能详的,比如均值、方差。如果你之前没有很强的概率论功底,建议你掌握常用知识后,在实际中遇到不懂的问题时要养成查阅的习惯。这部分知识不会太难,但是对理解模型与过程十分的重要:
- 比如为什么树模型一般不需要进行数据归一化?
- 而逻辑回归、神经网络、PCA中就必须进行数据归一化?
网络资源推荐
-
人工智能必备数学基础全套课程:此课程将高数、概率论、线代知识进行浓缩,针对人工智能领域开发的数学综合课程,都是入门必备和模型中常见的数学知识。
-
网易可汗学院统计学公开课:统计学入门课程,涵盖统计学所有的主要知识。
书籍推荐
这里推荐的是3本经典教材与1本我个人非常喜欢的《数学之美》。3本教材书无需多述,《数学之美》把抽象、深奥的数学方法解释得通俗易懂,非常精彩,很多模型原理都可以在其中找到你想要的回答。
三、数据分析
在具备一定的编程能力与数学功底后,我们就可以对实际问题进行分析与挖掘。
爬虫
很多同学问算法工程师需要学爬虫吗?我的回答是:算法的重点在于建模,算法工程师掌握基本爬虫知识就好,因为单位一般都有专门的采集工程师。
但是数据分析师一定需要学。因为数据分析师需要具备自主获取数据的能力,从而进行数据分析。
必备三剑客
不论你做数分还是算法,Numpy
、Pandas
和Matplotlib
都是必须掌握的。但这部分内容很杂,没必要进行系统学习,就好像Excel
中的函数一样。
网络资源推荐
-
【莫烦】Numpy&Pandas :此视频一共只有3小时,但是可以以最快的速度了解三剑客的基本使用。
大家可以网上找一些常用方法多浏览浏览,脑子里留个印象就行,在实际使用的时候再去查具体怎么用。就算没印象,我也建议大家在实际使用时先去官网上查有没有对应的内置方法,如果没有再自己写函数实现。
后续我也会总结三剑客的高频使用方法。
四、机器学习
从机器学习开始就正式进入到了人工智能的领域。ML
涉及的算法都是白盒算法,使用可解释的数学公式去拟合数据、学习参数然后进行预测,最后对模型进行评估。
这部分的知识需要大家从数据处理过程开始就多进行总结与反思:
- 数据清洗过程与特征工程是怎么做的?为什么会最终选用这些方法?
- 文本数据集常用的处理方法有哪些?适用的场景的是什么?
机器学习算法因为都有可解释性,所以大家需要搞懂数学原理,并知道模型之间的差异、以及适用于什么数据集。
对于回归任务与分类任务,我们也需要知道各种评估指标间的差异与使用场景。
网络资源推荐
-
吴恩达机器学习:此教程以理论为主,对小白极为友善,就算没有基础,也能以最快的速度入门机器学习。
-
菜菜的sklearn:此教程以实践为主,从数据处理、特征工程、到模型算法都会给予代码进行实操讲解,并将每个参数都讲的非常细致。
书籍推荐
这里推荐两本学习ML
必备书籍。周志华老师的《机器学习(西瓜书)》与李航老师的《统计学习方法》。
这两本书非常经典,讲述了机器学习核心数学理论与模型推导全过程,是夯实理论的不二选择。强烈推荐将书籍与上述推荐视频相结合进行学习。
五、深度学习
深度学习是黑盒算法,不具可解释性,初学者通常会觉得它比较神秘。但它的基础神经网络,可以说是由众多个逻辑回归函数组成,所以在学机器学习时一定要将逻辑回归彻彻底底学明白。
这部分给大家推荐书籍《图解深度学习》与《深度学习》。前者用图解的方式剖析了深度学习的原理,适合初学者;后者是深度学习领域奠基性的经典教程。
神经网络入门
- 浙大研究生课程:浙大老师上课录像,板书推导神经网络的原理,看完后你会入门深度学习,并感受到它的神奇与魅力。(P19-P24为神经网络)
CNN
与RNN
入门
-
吴恩达深度学习:首推荐还是吴恩达老师的课程:
- 不论往哪个方向发展,都先看神经网络部分
- 如果你之后想学图像方向,就接着看计算机视觉部分,然后对序列模型进行了解
- 如果准备往自然语言或推荐方向发展,则推荐先看计算机视觉部分,掌握
CNN
的基本常识后,再去学习序列模型全部内容
-
白板推导系列:机器学习与深度学习数学原理板书推导,极为硬核。
在学完理论知识后,我们就可以找一些项目进行实战了。
六、项目推荐
我本人是NLP
算法工程师,在此对自然语言处理方向推荐几个入门练手小项目:
-
Bert文本分类:在官网下载源码后进行
Debug
,不仅可以锻炼调试阅读代码的能力,而且可以掌握Bert
的细节。 -
实体识别:此项目使用了多种不同的模型(
HMM
、CRF
、Bi-LSTM
、Bi-LSTM+CRF
)来解决中文命名实体识别问题。 -
对话机器人:此项目为医疗对话问答机器人,主要基于知识图谱实现。
在对NLP
进行初步了解后,大家可以根据自身情况在Github
上多找一些感兴趣的相关项目进行研究,不仅仅要知道代码实现细节,更要思考它能实际解决的业务问题
👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
文章知识点与官方知识档案匹配,可进一步学习相关知识