目录
1.1 人工智能概述
1.1.1 机器学习与人工智能、深度学习
- 关系:
- 机器学习是人工智能的一个实现途径
- 深度学习是机器学习的一个方法(神经网络)发展而来
- 达特茅斯会议:人工智能的起点
- 1956.8 美国汉诺斯小镇达特茅斯学院
约翰 麦卡锡(John McCarthy)
马文 明斯基 (Marvin Minsky 人工智能与认知学专家 )
克劳德 香农 (Claude Shannon 信息论创始人)
艾伦 纽厄尔 (Allen Newell 计算机科学家)
赫伯特 西蒙 (Herbert Simon 诺贝尔经济学奖得主)等科学家一起讨论一个崭新的主题:
用机器来模仿人类学习以及其他方面的智能
会议足足持续了两个月,虽然大家没有达成普遍共识,但为会议的讨论内容起了一个名字:
人工智能
1956由此成为人工智能元年
- 1956.8 美国汉诺斯小镇达特茅斯学院
1.1.2 机器学习、深度学习的应用场景
- 挖掘、预测:
- 如店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类
- 图像识别:
- 交通标志识别、人脸识别
- 自然语言处理:
- 文本分类、情感分析、自动聊天、文本检测、客服
1.2 什么是机器学习
1.2.1 定义
机器学习就是从数据中自动分析获得模型,并利用模型对未知数据进行预测
1.2.2 理解
通过经验(历史数据)归纳(训练)规律(模型)应用(预测 )于未来
1.2.3 数据集构成
结构:特征值+目标值(label or class or answer)
房子面积 | 房子位置 | 房子楼层 | 房子朝向 | 价格(目标值) |
---|---|---|---|---|
80 | 9 | 3 | 0 | 80 |
100 | 9 | 5 | 3 | 120 |
80 | 10 | 3 | 0 | 100 |
注:
- 对于每一行数据我们称之为样本
- 有些数据集可以没有目标值
1.3 机器学习算法分类
- 目标
- 说明机器学习算法监督学习与无监督学习的区别
- 说明监督学习中的分类、回归特点
- 分类问题
- 特征值:每一个样本;目标值:类别,离散的
- 回归问题
- 特殊值:预测对象的不同属性;目标值:连续的
- 无监督学习
- 特征值:预测对象的不同属性;目标值:无
1.3.1 定义
- 监督学习(supervised learning)(预测)
- 定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(类别)
- 分类k-近邻、贝叶斯、决策树与随机森林、逻辑回归
- 回归 线性回归、岭回归
- 无监督学习(unsupervised learning)
- 定义:输入输出数据是由输入特殊值所组成
- 聚类 k-means