- 人工智能、机器学习和深度学习
人工智能和机器学习,深度学习的关系:
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法(神经网络)发展而来
- 主要分支介绍
通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力/应用对这三个技术领域进行介绍:计算机视觉(CV)、自然语言处理(NLP)和机器人。在NLP领域中,将覆盖文本挖掘/分类、机器翻译和语音识别。
分支一:计算机视觉
计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成,图像处理,图像提取,和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。
分支二: 语音识别
语音识别是指识别语音(说出的语音)并将其转换成对应文本的技术。相反的任务(文本转语音/TTS)也是这一领域内一个类似的研究主题。
分支三:文本挖掘/分类
这里的文本挖掘主要是指文本分类,该技术可用于理解、组织和分类结构化或非结构化文本文档。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。
分支四:机器翻译
机器翻译(MT)是利用机器的力量自动将一种自然语音(源语音)的文本翻译成另一种语音(目标语音)。机器翻译方法通常可分为三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。
分支五: 机器人
机器人学(Robotics)研究的是机器人的设计、制造、运行和应用,以及控制它们的计算机系统、传感反馈和信息处理
机器人可以分为两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。
- 人工智能发展必备三要素
数据、算法、计算力
逐层、分布、并行算法能力提升
GPU、FPGA、TPU能力大幅度提升
- 扩展: GPU与CPU对比
CPU – IO密集型
GPU – 计算密集型
Q:什么类型的程序适合在GPU上运行
A:计算密集型的程序。所谓计算密集型的程序,就是其大部分运行时间花在了寄存器上运算的,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时,可以做一下对比,读内存的延迟大概是几百个时钟周期,读硬盘速度就不说了,即便是SSD,也实在是太慢了
易于并行的程序。GPU其实是做一种SIMD架构,他有成百上千个核,每一个核在同一时间最好能做同样的事情。
- 什么是机器学习
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测
- 机器学习工作流程:
获取数据
数据基本处理
特征工程
机器学习(模型训练)
模型评估
- 获取到的数据集介绍
数据简介
- 在数据集中一般:
一行数据我们称为一个样本
一列数据我们成为一个特征
有些数据有目标值(标签值),有些数据没有目标值
- 数据类型构成:
数据类型一: 特征值 + 目标值(目标值是连续的和离散的)
数据类型二: 只有特征值,没有目标值
- 数据分割:
机器学习一般的数据集会划分为两个部分:
训练数据: 用于训练,构建模型
测试数据: 在模型检验时使用,用于评估模型是否有效
- 划分比例:
训练集: 70% 80% 75%
测试集: 30% 20% 25%
- 数据基本处理
即对数进行缺失值、去除异常值等处理
- 特征工程
特征工程:
把数据转换成机器更容易识别的数据
(特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。)
为什么需要特征工程:
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
特征工程包含内容
特征提取:
将任意数据(如文本或图像)转换为可用于机器学习的数字特征
特征预处理:
通过一些转换函数将特征数据转成更加适合算法模型的特征数据的过程
特征降维:
指在某些限定条件下,降低随机变量(特征)个数,得到一组"不相关" 主变量的过程
- 机器学习
选择合适的算法对模型进行训练
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
e4e9.png)
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)