ISL-Chap1&2.1笔记

本文是《An Introduction to Statistical Learning》的前两章笔记,介绍了Statistical Learning的基本概念,包括监督与非监督学习、回归与分类问题。通过实例探讨了为何以及如何估计函数f,讨论了预测精度与模型可解释性的权衡,并对比了参数化与非参数化方法的优缺点。
摘要由CSDN通过智能技术生成

写在前面

趁着假期重新刷一遍《An Introduction to Statistical Learning》,整理一下思路,也顺着这本书再重温一下R。小白水平,可能会有些理解上的错误,若有错误欢迎指正、讨论。
本系列笔记,内容主要参考《An Introduction to Statistical Learning》一书,若需引用请注明出处。

Chap1 Introduction

本章大略介绍了:

  1. 什么是 Statistical Learning :
    A vast set of tools for understandiing data 。 这些工具可以分为 “supervised” 和 “unsupervised”, 即 监督学习和非监督学习
  2. 本书使用的数据集。
  3. Statistical Learing 的历史。
  4. 这本书适合什么人学习。
  5. 符号的使用说明。
  6. 行文结构。

Chap2 Statistical Learning

2.1 什么是 Statistical Learning

本小节由 “如何提高销售量?” 这个问题引入。因此,我们的目标就是:建立一个可以通过三种媒体渠道(TV, radio, newspaper)的投入,精确预测销售量(sales)的模型。其中,销售量(Y-sales)是输出值,三个渠道的投入(X1-TV, X2-radio, X3-newspaper) 是输入值。YX1,YX2,Y~x3
若使用模型 f f f 来拟合 Y Y Y,那么一般形式可写作:
Y = f ( X ) + ϵ Y=f(X)+\epsilon Y=f(X)+ϵ
这里的 f f f 是关于各变量( X 1 , X 2 , . . . , X n X1,X2,...,Xn X1,X2,...,Xn) 的特定但目前还待求的函数。 ϵ \epsilon ϵ是随机误差项,它独立于 X X X且均值为0。
总的来说,Statistical Learning 指的就是一系列估计 f f f的方法。

2.1.1 Why Estimate f f f

建立模型(估计 f f f)主要的两种原因:Prediction or Inference

  1. Prediction:
    Y ^
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值