统计学习基础练习（Exercises for Overview of Supervised Learning）2

最新推荐文章于 2020-11-10 17:41:52 发布

江河湖海times

最新推荐文章于 2020-11-10 17:41:52 发布

阅读量607

点赞数

分类专栏：机器学习理论知识

本文链接：https://blog.csdn.net/jiang_he_hu_hai/article/details/81007255

版权

机器学习理论知识专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Exercises for Overview of Supervised Learning

Ex.2.1 假设 $K$ -类，每一类都有一个相关联的目标 $t_k$ ， $t_k$ 是一个第 $k$ 个位置等于1，所有位置都是0的向量。如果 $\hat y$ 中元素和为1，证明对 $\hat y$ 中最大元素进行分类等价于计算最接近的目标 $\min_k\|t_k-\hat y\|$

证明：假设 $\hat y=(y_1,y_2,\dots,y_K)$ ， $\min_k\|t_k-\hat y\|$ 等价于 $\min_k\|t_k-\hat y\|_2^2$ 。
不防假设 $\hat y$ 属于第1类，也就是说 $y_1\ge y_i \forall i\in \{1,2,\dots,K\}$
$\Longleftrightarrow -2y_1+1\le-2 y_i+1 \forall i\in \{1,2,\dots,K\} \\ \Longleftrightarrow \sum_t y_t -2y_1+1\le \sum_t y_t -2y_i+1\\ \Longleftrightarrow\|t_1-\hat y\|\le\|t_i-\hat y\| \forall i\in \{1,2,\dots,K\}$

Ex.2.2 如何计算Figure 2.5中模拟示例的Bayes决策边界
参考网友
Ex.2.3 推导等式：均匀分布在 $p$ 维单位球内的 $N$ 个点，其中到圆心距离最近点的距离的中位数是

d (p, N) = (1 - 1 2 1 N) 1 p

$d(p,N)=(1-\frac 12 ^{\frac1N})^\frac 1p$

首先，我们解释一下距离的中位数。假设距离的中位数是 $d$ ,也就是说距离比 $d$ 大的和比 $d$ 小的概率一样。
我们知道 $\mathbb R^p$ 中半径为 $r$ 的球体积是 $\omega_pr^p$ ，其中

$ω p = π p 2 p 2 !$ $\omega_p=\frac {\pi^{\frac p2}}{\frac p2!}$
因为单位球中每一点都是等概率的，那么任取一点，它到原点的距离小于 $x$ 的概率是半径为 $x$ 球的体积除以单位球的体积，因此我们可以的得到CDF(累计密度函数,Cumulative Distribution Function):
$F (x) = x p, 0 \leq x \leq 1.$ $F(x)=x^p,\ \ 0\le x\le 1.$
那么相应的导数就是概率密度函数(PDF probability density function)：
$f (x) = p x p - 1$ $f(x)=px^{p-1}$
假设我们随机选取 $N$ 个点 $\{y_1,y_2,\dots,y_N\}$ ，如果其中最小的一个点等于 $y$ ，也就是说其中有 $N-1$ 个点不小于 $y$ ，其概率是 $N(1-F(y))^{N-1}$ ，在此基础上，最小一个点是 $y$ 的概率密度函数是
$g (y) = N (1 - y^{p})^{N - 1} p y^{p - 1}$ $g(y)=N(1-y^p)^{N-1}py^{p-1}$
对此概率密度函数（PDF）进行积分就可以得到累计密度函数（CDF）
$G (y) = 1 - (1 - y p) N$ $G(y)=1-(1-y^p)^N$
取 $G(y)=0.5$ 就可以得到随机取 $N$ 个点，到圆心最近点距离中位数了。

Ex2.4讨论的边沿影响问题不是有界域均匀抽样独有的。考虑取自球形多项分布 $X\sim N(0,I_p)$ 的输入。从任意样本点到原点的平方距离服从具有均值 $p$ 的 $\chi_p^2$ 分布。考虑取自该分布的预测点 $x_0$ 。并设， $a=\frac{x_0}{\|x_0\|}$ 是一个相关的单位向量 $z_i=a^Tx_i$ 为每个训练点在该方向上的投影。
（a）证明 $z_i$ 分布在 $N(0,1)$ 上，具有到原点的期望平方距离 $1$ ，而目标点具有到原点的期望平方距离 $p$ 。
(b）对于 $p=10$ ，证明从训练数据的中心到检验点的期望距离是 $3.1$ 倍标准差，而所有训练点沿方向a具有期望距离 $1$ 。从而，大部分预测点位于训练集的边沿。

Ex2.5(a)推导等式(2.27)

$\begin{aligned} E P E (x_{0}) & = E_{y_{0} | x_{0}} E (y_{0} - {\hat{y}}_{0})^{2} \\ = V a r (y_{0} | x_{0}) + E [{\hat{y}}_{0} - E {\hat{y}}_{0}]^{2} + [E {\hat{y}}_{0} - x_{0}^{T} - x_{0}^{T} β] \\ = V a r (y_{0} | x_{0}) + V a r ({\hat{y}}_{0}) + B i a s^{2} ({\hat{y}}_{0}) \\ = σ^{2} + E x_{0}^{T} (X^{T} X)^{- 1} x_{0} σ^{2} + 0^{2} \end{aligned}$ $\begin{align*} EPE(x_0) &=E_{y_0|x_0}E(y_0-\hat y_0)^2 \\ &=Var(y_0|x_0)+E[\hat y_0-E\hat y_0]^2+[E\hat y_0-x_0^T-x_0^T\beta]\\ &=Var(y_0|x_0)+Var(\hat y_0)+Bias^2(\hat y_0)\\ &=\sigma^2+Ex_0^T(X^TX)^{-1}x_0\sigma^2+0^2 \end{align*}$

(b)推导等式(2.28)

$E x 0 \sim E x 0 x T 0 C o v (X) - 1 x 0 σ 2 N + σ 2 = t r a c e [C o v (X) - 1 C o v (x 0)] σ 2 N + σ 2 = σ 2 p N + σ 2$ $\begin{align*} E_{x_0}&\sim E_{x_0}x_0^TCov(X)^{-1}x_0 \frac {\sigma^2}N+{\sigma^2}\\ &=trace[Cov(X)^{-1}Cov(x_0)]\frac {\sigma^2}N+{\sigma^2}\\ &={\sigma^2}\frac pN +{\sigma^2} \end{align*}$

证明：对于(a)，这个是一个经典的分解，
$expected loss =bias^2+variance +noise$ ，网上很多，具体证明看网友的吧
对于(b)

Ex. 2.6

Ex. 2.7

Ex. 2.8

Ex. 2.9

end

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

江河湖海times

关注关注

0
点赞

踩

0

收藏

觉得还不错? 一键收藏

0
评论

统计学习基础练习（Exercises for Overview of Supervised Learning）2

Exercises for Overview of Supervised Learning假设KKK-类，每一类都有一个相关联的目标tktkt_k，tktkt_k是一个第kkk个位置等于1，所有位置都是0的向量。如果y^y^\hat y中元素和为1，证明对y^y^\hat y中最大元素进行分类等价于计算最接近的目标mink∥tk−y^∥mink‖tk−y^‖\min_k\|t_k-\hat y...
复制链接

扫一扫

专栏目录

统计学习（二）：统计推断

wong2016的博客

06-27 2397

概念所谓统计推断( statistical inference )，指的是给定样本 x1,x2,…,xnx_1, x_2,\dots, x_n 下，如何推断总体 FF ? 或者 FF 的数字特征，如均值、方差等。统计模型参数模型参数模型，指的是一个分布集合 F\mathfrak{F}, 其中的参数可以由有限个参数给定。例2.1 一维正态分布集 F={f(x;μ,σ2):f(x;μ,σ2)=12π−

统计学习基础笔记与习题答案

09-20

统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案统计学习基础笔记与习题答案

参与评论您还未登录，请先登录后发表或查看评论

【统计学习基础】2. Overview of Supervised Learning

厄多斯L的博客

06-07 257

supervised learning to used inputs to predict the values of the outputs. inputs predictors; independent variable; features; outputs responses

统计学习基础课后答案

02-03

The Elements of Statistical LearningThe Elements of Statistical LearningThe Elements of Statistical LearningThe Elements of Statistical Learning

统计学习基础

12-12

数据挖掘，推理于预测中文版 trevor hastie robert tibshirani jerme friedman

Java-Learning-Exercises:我的Java学习与练习

03-04

描述中提到的"Java学习练习"可能包括了对基本语法、控制结构（如if语句、for循环、while循环）、数组、字符串处理、异常处理以及面向对象编程概念的练习。这些练习是学习任何编程语言的关键部分，因为它们帮助开发者...

deeplearning_andrewng：吴安德深度学习课程的练习

02-04

吴恩达的Coursera深度学习专业课程因为这些出色的练习值得多次重做！ master分支是空练习，没有任何修改。（以便您可以自己下载并完成）其他分支是我的答案，也许可以为您提供帮助。

Machine-Learning-Exercises:机器学习实验室练习

04-06

机器学习练习

计算理论基础练习题Exercises和答案

09-29

本资料集包含了一系列的练习题及答案，旨在帮助学习者深入理解计算理论的核心概念，并提升解决问题的能力。以下是根据提供的信息，对计算理论基础练习题及其答案的详细解析： 1. **计算模型**：计算理论通常涉及...

Exercises for Article of Lecture 4.pdf

12-06

Exercises for Article of Lecture 4.pdf

统计学习基础—中科大-卿来云

01-02

统计学习基础—中科大-卿来云视频课程，内含配套PPT及课后习题答案，答案不全，工科类研究生普遍开设科目，感兴趣可以下。

中科大统计学习作业和编程题r.pdf

10-17

中科大研究生课程，刘东，统计学习课程作业和编程题目。

中科大-自然计算与应用-课程ppt（人工神经网络、进化计算）

07-16

中科大-自然计算与应用-课程ppt（人工神经网络、进化计算）

统计学题目.pdf

09-27

统计学题目.pdf

统计学习基础卿来云中科院研究生课程ppt

01-22

统计学习基础卿来云中科院研究生课程ppt,卿来云，副教授。研究方向，多媒体技术。现为中国科学院研究生院信息科学与工程学院副教授。目前主要从事计算机视觉与多媒体技术方面的研究与开发工作。2005年6月获计算机软件与理论专业博士学位，2005年7月进入中国科学院研究生院信息学院工作。在国内外各种重要学术刊物和学术会议上发表论文20余篇。现承担国家863项目《基于生物感知认知的视觉神经信息编码技术的研究》和国家自然科学基金项目《基于时间振荡相关与空间整合编码的视觉感知-眼动控制神经网络系统的模拟研究与应用》。

统计学习基础ESL笔记目录

Spicywings的博客

07-10 622

The Elements of Statistical Learning 笔记目录篇在学校课程中学习了 ‘An Introduction to Statistical Learning’（简称ISL），但实际上ISL这本书很多地方只是对算法的简单介绍，许多部分并不详细（硬核），因此买了一本更硬核的书’The Elements of Statistical Learning’（简称ESL），这两本书结构类似，但内容难易程度与侧重点不同，会结合ISL的边读边更新与修改，本文作为目录与导航，以供查看。 ...

ESL第二章Overview of Supervised Learning knn有效参数、统计决策理论/贝叶斯分类器/贝叶斯阶、维度灾难、可加误差模型、三次光滑样条/核方法/基函数/字典方法

小树屋

11-10 411

（开始读ESL，写点笔记，不会像PRML那样抄书，只列不熟悉的内容，尤其是偏频率派的。具体的内容翻书）前言和第一章写了一些思想性的和导论性的东西，可以翻一翻目录2.3 Two Simple Approaches to Prediction: Least Squares and Nearest Neighbors2.3.3 Nearest-Neighbor Methods 2.3 Two Simple Approaches to Prediction: Least Squares and Nearest

《统计学习基础》简介

weixin_42077402的博客

06-02 413

今天开始刷《统计学习基础》(第二版) 这本书，英文名为 The Elements of Statistical Learning (Version II) 原文链接：https://web.stanford.edu/~hastie/ElemStatLearn/ 之前听很多朋友、老师推荐过，说这本书是机器学习的基础，同时也看到某些网友回复" 一点都不基础，教材中有大量艰深的统计推断、矩阵、数...

统计学习方法——统计学习基础（一）

wk19951125的博客

03-13 1542

统计学习方法——统计学习统计学习概论（一）统计学习统计学习的特点统计学习的方法监督学习基本概念问题形式化统计学习的三要素模型策略算法模型评估与模型选择训练误差与测试误差过拟合、欠拟合与模型选择参考文献统计学习概论（一）统计学习统计学习的特点建立在计算机与网络的基础上以数据为研究对象基本假设：同类数据具有一定的统计规律性。以方法为中心常用方法监督学习非监督学习半监督...

《单片机基础》练习题及答案(推荐文档).doc

最新发布

10-20

The document "《单片机基础》练习题及答案(推荐文档).doc" is a comprehensive resource for practicing and understanding the basics of single-chip microcomputer technology. It provides a series of ...

“相关推荐”对你有帮助么？

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交