机器学习

一、机器学习是怎么发展起来,成为热搜的?

机器学习在20世纪50、60年代就已被提出,并成为当时的热门,中间潮起潮落,很长一段时间沉寂,不温不火。

但近几年随着与其相关的人工智能频繁上热搜,主要有以下原因:

  • 算力提升:云计算、GPU硬件的发展
  • 算法发展:神经网络由于其浅层结构,容易过拟合以及参数训练速度慢等原因,长期难以发展,而2006年后,深度学习相关的多层神经网络算法取得关键突破
  • 热点应用:Google阿法狗大胜人类围棋大师
  • imagenet社区:该社区为算法提供了大量数据养料,对推动算法精度的提升作出突出贡献

二、机器学习到底是个啥?

机器学习相对人类学习。

目的是让机器能够像人类一样具备学习能力,能够感知世界、认知世界和改造世界。

  • 感知世界:即视觉、听觉、触觉等感知能力,当前机器学习在感知世界方面已经和人类水平持平甚至超过人类;
  • 认知世界:能够理解、思考和具备意识,机器学习在这方面处在起步和发展阶段;
  • 改造世界:愚蠢的人类,呵呵。

我们要先看看人类是怎样学习的?

人类通过观察、阅读、经历等获取信息,然后使用归纳、演绎等方法进行学习,最后得到知识和智慧;

图1:人类学习与机器学习

而机器学习是通过数据训练,使用算法挖掘事物背后隐藏的规律和本质,得到模型。

机器学习可以简单理解由三大核心要素组成:数据+算法=模型。机器学习模型其实是对现实世界规律和本质的数字化抽象。

  • 机器(数据) => 人类学习(观察、阅读、经历)
  • 机器(算法) => 人类学习(归纳、演绎)
  • 机器(模型) => 人类学习(知识/智慧)

机器学习的关键是数据,算法是其次。一般来说:

大数据集+一般算法 优于 小数据集+好算法。

数据决定了机器学习的上限,算法只是逼近这个上限而已。

 

另外,机器学习相关的一些领域包括人工智能、大数据、深度学习等,它们之间的关系如下图:

图2:机器学习与相关领域的关系

三、机器学习怎么学习?

机器学习运作机理大概如下图(当然详细过程还有数据预处理、特征选择等,在此不做说明):

机器学习过程

  • 训练数据集:从历史数据集中拿出一部分数据作训练集,用来训练模型;
  • 算法选择:一般会根据业务场景和经验从多种算法中,选定一个适合该业务场景的算法
  • 模型训练:通过算法+数据(训练集)进行训练,得到初步的模型;
  • 模型评估:输入测试集,通过一些指标,如准确率,评估模型的好坏;如果模型好则使用该模型,如果模型评估结果不好,则通过调整训练集、调整算法参数甚至更换算法,不断调整模型;
  • 模型使用:将需要预测的数据输入至模型,得到最终的预测结果

从学习方式来说,机器学习还可分为监督学习、非监督学习、半监督学习,学习过程和上图类似,主要区别在于训练数据集里告不告诉机器正确答案。

  • 训练集给定了正确答案的叫监督学习,主要用于分类预测和回归预测
  • 训练集未指定正确答案的为非监督学习,主要用于聚类

机器学习重要的几个算法。

  • 决策树 :基于规则的一种分类算法
  • 朴素贝叶斯 :基于概率的一种分类算法,主要用于文本的分类
  • SVM :主要用于非线性可分的分类算法
  • KNN :基于距离的一种分类算法
  • 线性回归:主要用于预测目标结果为连续值的问题
  • 逻辑回归:主要用于预测目标结果为离散值的问题
  • 神经网络 :主要用于深度学习

机器学习常见的算法引擎

  • SparkML
  • R
  • sklearn
  • Caffe
  • pytorch
  • tensorflow
  • kera
  • mxnet

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值