统计机器学习(机器学习) 概念

最新推荐文章于 2024-08-04 23:34:11 发布

Gzzgz

最新推荐文章于 2024-08-04 23:34:11 发布

阅读量1.7k

点赞数 1

分类专栏： Statistics & Machine Learning 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mmmmmttttff/article/details/51104055

版权

Statistics & Machine Learning 专栏收录该内容

24 篇文章 0 订阅

订阅专栏

统计机器学习(机器学习) 概念

该文章是作者阅读相关书籍和资料后，总结和归纳的一些个人认为有必要整理和了解的知识点介绍。与大家一起分享，如有不妥之处，还望指正。

统计（机器）学习

1．统计学习概念

统计学习也叫统计机器学习（statistical machine learning），是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科，并且在发展中逐步形成独自的理论体系与方法论。现在提及的机器学习往往指的是统计机器学习。

Herbert A.Simon对“学习”的定义是：如果一个系统能够通过执行某个过程来改进它的性能，这就是学习。

Mitchell,1997 给学习的一个形式化定义：假设用P来评估计算机程序在某一任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能改善，则我们就说关于T和P，该程序对E进行了学习。

1956年，在IBM公司研发了西洋跳棋程序的Arthur Samuel 发明了machine learning 一词，将其定义为“不显式编程地赋予计算机能力的研究领域”。

2. 基本假设

统计学习关于数据的基本假设是同类数据具有一定的统计规律性。这里的同类数据指的是具有同类性质的数据，“某一类”的数据。之所以称之为“某一类”就说明数据呈现相同的性质，而往往也具有相同的统计特性。

3. 统计学习方法

统计学习由监督学习、半监督学习、无监督学习、强化学习等组成。主要讨论有监督学习（有监督学习研究相对而言比较成熟和深入，也具有代表性）。书本的概括如下：

从给定的、有限的、用于学习的训练数据集合出发，假设数据是独立同分布产生的；并且假设要学习的模型属于某个函数的集合，称为假设空间(hypothesis space);应用某个评价准则，从假设空间中选取一个最优的模型，使得它对已知训练数据及未知测试数据在给定的评价准则下有最优的预测；最优模型的选取由算法实现。这样统计学习方法就包括模型的假设空间、模型的选择准则和模型的学习算法，称为统计学习方法的三要素，简称：模型（model）、策略（strategy）、算法（algorithm）。可以更形象的称之为：

方法=设想+指标+方案

4. 基本术语

机器学习: machine learning

模型: model

数据集： data set

示例： instance

样本： sample

属性： attribute

特征： feature

属性值： attribute value

属性空间： attribute space

样本空间（输入空间）： sample space

特征向量： feature vector

维数（维度）： dimensionality

学习： learning

训练： training

训练样本： training sample

训练集： training set

假设： hypothesis

真实（真相）： ground truth

预测： prediction

标记（标签）： label

样例： example

标记空间（输出空间）：label space

分类： classification

回归: regression

二分类： binary classification

正类： positive class

反类： negative class

多分类： multi-class classification

测试： testing

测试样本： testing sample

聚类： clustering

簇： cluster

有监督学习： supervised learning

无监督学习： unsupervised learning

泛化： generalization

分布： distribution

独立同分布： independent and identically distributed. i.i.d.

归纳： induction

演绎： deduction

特化： specialization

概念： concept

版本空间： version space

输入空间：input space

输出空间： output space

特征空间： feature space

决策函数： decision function

损失函数： loss function

主要参考资料：

《统计学习方法》李航著

《机器学习实战》Peter Harrington著李锐等译

《机器学习》周志华著

《模式分类》Richard O.Duda 等著

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Gzzgz CSDN认证博客专家 CSDN认证企业博客

码龄14年

39: 原创

18万+: 周排名

75万+: 总排名

13万+: 访问

: 等级

1772: 积分

61: 粉丝

33: 获赞

12: 评论

37: 收藏

私信

关注

热门文章

分类专栏

最新评论

表情识别数据
晨晖将歇: 您好，请问您有AVEC2013的数据集吗，我现在在做抑郁识别方向，但是AVEC2013官网已经进不去了
Canny
qq_30946231: 你好，您说的关于双阈值的选择讨论在哪里呀0.0
windows下编译Matconvnet的方法(CPU和GPU)
m0_37918506: 博主，你好！我在用cifar-10测试时出现这个问题，一直未能解决，希望能得到你的帮助！ train: epoch 01: 1/500: 99.4 (99.4) Hz objective: 3.010 top1err: 0.880 top5err: 0.580 train: epoch 01: 2/500:Error using fliplr (line 18) X must be a 2-D matrix. Error in cnn_cifar>getSimpleNNBatch (line 79) if rand > 0.5, images=fliplr(images) ; end Error in cnn_cifar>@(x,y)getSimpleNNBatch(x,y) (line 68) fn = @(x,y) getSimpleNNBatch(x,y) ; Error in cnn_train>processEpoch (line 325) [im, labels] = params.getBatch(params.imdb, batch) ; Error in cnn_train (line 150) [net, state] = processEpoch(net, state, params, 'train') ; Error in cnn_cifar (line 57) [net, info] = trainfn(net, imdb, getBatch(opts), ... >>
windows下编译Matconvnet的方法(CPU和GPU)
fanxinory: cuda6.5以上的计算能力要求是3.0
Caffe for windows 训练cifar10数据集
: 我换了分类器解决了没用这个classification.cpp

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。