人工智能 笔记1
#人工智能#
人工智能定义:以机器为载体所展示出来的人类智能,也被称作机器智能
模拟方式
-
逻辑推理→以符号主义为核心:将概念符号化(高度概括、抽象、严格化和精确化),从若干判断为前提出发得到新的判断作为结论
包括归纳推理、演绎推理、因果推理等(特殊到一般、一般到特殊、事实与反事实都成立);
逻辑推理在人工智能领域推动了专家系统的产生;
从知识到知识;
解释性强但但难以拓展;
-
探寻搜索→以问题求解为核心:依据已有信息寻找满足约束条件的带求解问题
包括无信息搜索(广度优先和深度优先)、有信息/启发式搜索(贪婪最佳优先和A*)、对抗搜索(最大最小搜索、Alpha-beta剪枝搜索、和蒙特卡洛树搜);
从已有的答案中查找,但桎梏于机械师匹配;
-
机器学习→以数据驱动为核心:从数据中发现数据所承载的语义的内在模式
包括监督学习(判别式学习:回归分析、提升算法、支持向量机、决策树等;生成式学习:隐狄利克雷分布LDA、隐马尔可夫链)、无监督学习(聚类、降维、最大期望算法)、半监督学习,区别就是数据标注与否;
从数据到知识;
善于预测但是过程难以理解;
-
强化学习→以行为主义为核心:根据环境提供的奖惩反馈来学习所处状态可施加的最佳行动,利用已有经验探索未知空间,完成某个序列化任务,具备自我学习能力
智能体的自监督学习(尝试-试错与探索-利用),针对序列的优化学习方法;
深度强化学习:加入了神经网络的Q-learning;
善于对未知空间的探索但是依赖于学习策略;
监督学习 无监督学习 强化学习 学习依据 基于监督信息 基于对数据结构的假设 基于评价 数据来源 一次性给定的标注信息 一次性给定的无标注信息 与环境交互中产生的,序列结束后反馈的明确奖惩值 决策过程 单步静态决策 无 根据环境给出的滞后回报做出序列决策 学习目标 样本空间到高级语义空间的映射 同一类数据的分布模式 最大收益状态的动作映射 -
群体智能→以博弈对抗为核心:从数据拟合优化求解迈向均衡求解
两害相权取其轻,两利相权取其重;
在完全信息下表现优良,但非完全信息下没有通用框架;