人工智能初学2

1、解决过程

向计算机传入多组数据,设置标签,根据数据让计算机进行机器学习,运用相应模型解决问题,从而达到预测新数据的效果。

2、有监督和无监督

监督式学习根据已知的输入和输出训练模型,让模型能够预测未来输出。如果尝试去预测已知数据的输出,则使用监督式学习。监督式学习采用分类和回归技术开发预测模型。

分类技术可预测离散的响应 分类模型可将输入数据划分成不同类别。可以是二类别问题(是/不是),也可以是多类别问题(在多个类别中判断输入数据具体属于哪一个类别)如果数据能进行标记、分类或分为特定的组或类,则使用分类。

典型的应用包括医学成像、语音识别、信用评估、电子邮件是不是垃圾邮件、肿瘤是恶性还是良性的、笔迹识别的应用程序使用分类来识别字母和数字。

回归技术可预测连续的响应 如果处理一个数据范围,或响应性质是一个实数(比如温度,或一件设备发生故障前的运行时间),则使用回归方法。通过建模和分析变量之间关系,目的是通过模型来计算得出一个具体的值。

回归模型有两种,一种是可以用一条回归线拟合的数据,有明显的函数关系,可以通过线性性回归等方式进行拟合;第二种就是无明显线性关系,这时候就认为长得相似的样本值也相同。

例如,温度的变化或电力需求中的波动。典型的应用包括电力系统负荷预测和算法交易。

这两者的本质是一样的,仅仅是输出形式不同而已。当然由于其输出形式不同,在构建误差函数(就是监督系统中的使得盒子往正确答案发展的驱动装置)时会有区分

无监督学习 输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)试图使类内差距最小化,类间差距最大化。通俗点将就是实际应用中,不少情况下无法预先知道样本的标签,也就是说没有训练样本对应的类别,因而只能从原先没有样本标签的样本集开始学习分类器设计。从输入数据中找出隐藏模式或内在结构。这种技术可根据未做标记的输入数据集得到推论。

非监督学习目标不是告诉计算机怎么做,而是让它(计算机)自己去学习怎样做事情。

聚类是一种最常用的无监督学习技术。

在以下情况下选择监督式学习:需要训练模型进行预测(例如温度和股价等连续变量的值)或者分类(例如根据网络摄像头的录像片段确定汽车的技术细节)。

在以下情况下选择无监督学习:需要深入了解数据并希望训练模型找到好的内部表示形式,例如将数据拆分到集群中。

两者的不同点

1. 有监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对测试样本使用这种规律。而非监督学习没有训练集,只有一组数据,在该组数据集内寻找规律。

2. 有监督学习的方法就是识别事物,识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。而非监督学习方法只有要分析的数据集的本身,预先没有什么标签。如果发现数据集呈现某种聚集性,则可按自然的聚集性分类,但不予以某种预先分类标签对上号为目的。

3. 非监督学习方法在寻找数据集中的规律性,这种规律性并不一定要达到划分数据集的目的,也就是说不一定要“分类”。

这一点是比有监督学习方法的用途要广。如分析一堆数据的主分量,或分析数据集有什么特点都可以归于非监督学习方法的范畴。

何时采用哪种方法

有训练样本则考虑采用监督学习方法;无训练样本,则一定不能用监督学习方法。但是,现实问题中,即使没有训练样本,我们也能够凭借自己的双眼,从待分类的数据中,人工标注一些样本,并把它们作为训练样本,这样的话,可以把条件改善,用监督学习方法来做。对于不同的场景,正负样本的分布如果会存在偏移(可能大的偏移,可能比较小),这样的话,监督学习的效果可能就不如用非监督学习了。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值