对于“统计学习方法”的系统学习(一)

    学习教材采用清华大学李航博士所著的《统计学习方法》

    一、统计学习方法三要素模型,策略,算法。

    二、实现统计学习方法的步骤

        1、得到一个有限的训练数据集合;

        2、确定包含所有可能的模型的假设空间,即学习模型的集合;

        3、确定模型选择的准则,即学习的策略;

        4、实现求解最优模型的算法,即学习的算法;

        5、通过学习方法选择最优模型;

        6、利用学习的最优模型对新数据进行预测或分析。

    三、统计学习包括:监督学习非监督学习半监督学习强化学习

        监督学习:输入变量和输入变量均为连续变量的预测问题为回归问题输出变量为有限个离散变量的预测问题为分类问题输入变量和输出变量均为变量序列的预测问题称为标注问题

        统计学习假设数据存在一定的统计规律,X和Y具有联合概率分布的假设就是监督学习关于数据的基本假设。

        方法=模型+策略+算法

        由决策函数表示的模型为非概率模型,由条件概率表示的模型为概率模型

        损失函数(loss Function,代价函数cost Function):度量模型一次预测的好坏;风险函数:度量平均意义下的模型预测的好坏。

        常用损失函数:

        (1) 0-1损失函数;        (2) 平方损失函数;        (3) 绝对损失函数;        (4)对数损失函数

        经验风险最小化结构风险最小化(正则化)

        结构风险在经验风险上加上表示模型复杂度的正则化项(regularizer)或罚项(penalty term)


    


    


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
授课对象: 这是一门数学课程,适合有志于转往大数据分析领域的非数学专业人士(例如IT人,业务人员等)补强数学基础,以更好地学习更高级的数据分析,数据挖掘,机器学习课程 收获预期: 可以大幅度提高学员的数学基础,使其学习其它大数据分析课程时觉得更加简单,得心应手 课程内容: 第1课 面向小白的统计学:描述性统计(均值,中位数,众数,方差,标准差,与常见的统计图表) 第2课 赌博设计:概率的基本概念,古典概型 第3课 每人脑袋里有个贝叶斯:条件概率与贝叶斯公式,独立性 第4课 啊!微积分:随机变量及其分布(二项分布,均匀分布,正态分布)& J. e3 P: w6 X2 ^; K* W1 U& X 第5课 万事皆由分布掌握:多维随机变量及其分布4 o7 |% v% n9 \" m4 R) | 第5课 砖家的统计学:随机变量的期望,方差与协方差" s4 @+ n. v" I: V) `- u 第6课 上帝之手,统计学的哲学基础:大数定律、中心极限定理与抽样分布+ j: W+ V/ n1 _4 Y) `/ w+ [ 第8课 点数成金,从抽样推测规律之一:参数估计之点估计$ v3 ^1 V. H( t, G9 b: U 第9课 点数成金,从抽样推测规律之二:参数估计之区间估计 第10课 对或错?告别拍脑袋决策:基于正态总体的假设检验 第11课 扔掉正态分布:秩和检验! s! G1 w# i3 P* ]# e 第12课 预测未来的技术:回归分析, O% b! U) k4 h# ]$ p 第13课 抓住表象背后那只手:方差分析 第14课 沿着时间轴前进,预测电子商务业绩:时间序列分析简介, X. n% b4 ~8 P E9 \+ d 第15课 PageRank的背后:随机过程与马尔科夫链简介
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值