1.概述
人工智能的定义:人工智能 (Artificial Intelligence): 是用机器去实现所有目前必须借助人类智慧才能实现的任务。其具体研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统。
人工智能方法:
人工智能是一个概念性而非形式化定义,包含多种方法论:
- 仿生角度:模拟自然生物信息处理过程。
- 符号学角度:用统计概率、数理逻辑、博弈搜索等实证
- 行为学角度:以控制论实现机器自我进化
- 交叉角度:上述多种角度的合成
机器学习应用:机器学习是人工智能的一个重要分支,是实现智能化的关键。通常解决一些人为设计和使用确定性程序很难解决的问题;提高对机器学习的认识,将提高我们自身对智能背后原理的理解。因此受到极大关注。
- 经典定义:利用经验来改善计算机系统的性能
- 经验:在计算机系统中,即为数据(集)
- 主要目标:预测未知、理解系统
大数据问题:从实际的需求来看,随着数据采集和计算机能力的增加,积累了大量的数据,而且绝大部分是非结构化(语义不清楚、稀疏)数据。先前的机器学习方法收效甚微
特征的局限性:
人类信息分级处理:人的视觉系统的信息处理是分级的;高层的特征是底层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者意图;抽象层面越高,存在的可能猜测就越少,就越利于分类。
人工神经网络:是从微观结构与功能上模拟人脑神经系统而建立的一类模型,是模拟人的智能的一条途径。信息处理由人工神经元间的相互作用来实现,由联接权来传递,具有学习能力、自适应性、联接强度的可变性。神经网络是人脑的抽象、简化和模拟,反映了人脑功能的若干基本特征:
- 网络的信息处理,由神经元间的相互作用实现,具有并行处理的特点;
- 知识与信息的存储,表现为神经元间分布式的物理联系;
- 网络的学习和识别,决定于神经元联接权系数的动态演化过程;
- 具有联想记忆特性。
2.线性分类与感知机
2.1 线性回归
线性回归要素:
- 房屋销售记录表: 训练集(training set)或者训练数据(training data), 是我们流程中的输入数据, 一般称为x
- 房屋销售价钱: 输出数据, 一般称为y
- 拟合的函数( 或者称为假设或者模型) : 一般写做y=h(x);如果是直线,则为y=kx+b
- 训练数据的条目数(#training set): 一条训练数据是由一对输入数据和输出数据组成的, 输入数据的维度n(特征的个数,#features)
学习过程:
2.2 线性分类
2.2.1定义
线性分类器则透过特征的线性组合来做出分类决定,以达到此种目的。简言之,样本通过直线(或超平面)可分。
2.2.2线