机器学习与数据挖掘 第一讲 定义与PLA算法

机器学习与数据挖掘 第一讲 定义与PLA算法

  1. 机器学习的实质
  2. 机器学习的组成部分
  3. 感知机模型举例

机器学习的定义与本质

Machine learning

Tom M. Mitchell定义:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

即给定任务的条件下,机器学习在通过数据练习获得经验(如某模型或者假设),并可以通过某测量指标量化其对该任务的性能。

Essence

  • 存在可学习的规律或模式
  • 有能够学习到规律的数据
  • 无法用精确的数学公式表达或无法编程实现

Component of Learning

  • 输入:1. 数据集data 2.假设集合 H H H
  • 目标函数: f f f --假设集合中的理想表达
  • 输出: g g g --通过提取data特征,在 H H H中最终选取输出 g ≈ f g\approx{f} gf

PLA(Perceptron Learning Algorithm )

感知器(perceptron)1957年由Rosenblatt提出,是神经网络与支持向量机的基础。为二类分类的线性分类模型,输入为实例的特征向量,输出为实例的类别(取+1和-1二值)。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型感知机学习旨在求出将训练数据进行线性划分的分离超平面。

组成部分

  • 特征空间 X ⊆ R n X\subseteq{R^n} XRn
  • 输出空间 Y = Y= Y={-1,+1}
  • 目标函数 h ( x ) = s i g n ( w T x ) h(x)=sign(w^Tx) h(x)=sign(wTx)

算法思路

  1. 初始状态分类器认为所有数据为错误,任意找一数据修正, w w w为分离平面的法向量,分离平面垂直法向量
  2. x g x_g xg为错分数据,则将原来的法向量和数据向量相加,得到旋转之后的法向量,进而不断修正分离超平面,直到所有数据正确分类。

修正思路:若 x g x_g xg被错分为正例,则旋转后的 w + y x w+yx w+yx靠近 X X X向量;若为错分负例,则旋转后的 w + y x w+yx w+yx远离 X X X向量。

  1. 通过不断遍历特征向量,校正 W t W_t Wt,达到最终 W f W_f Wf

PLA算法终止条件

  • 线性可分
  • W f T ∣ ∣ W f ∣ ∣ W T ∣ ∣ W T ∣ ∣ ≥ T ⋅ c o n s t a n t \frac{W^T_f} {||W_f||}\frac{W_T} {||W_T||}\geq {\sqrt T} \cdot constant WfWfTWTWTT constant , T T T为修正数。其证明可参考该博客。1

此外,台大机器学习基石和【机器学习基础】从感知机模型说起对感知机模型提供了较好的图片解释。

R实现


# download the dataset
temp <- read.csv2("https://www.csie.ntu.edu.tw/~htlin/mooc/datasets/mlfound_math/hw1_15_train.dat",header = F,stringsAsFactors=FALSE,sep = "")
names(temp)=c("x1","x2","x3","x4","y")
# convert to numeric
indx <- sapply(temp,is.character)
temp[indx] <- lapply(temp[indx],function(x) as.numeric(as.character(x)))
str(temp)

PLA <- function(data,delta){
  x <- data[,-dim(data)[2]]
  y <- data[,dim(data)[2]]
  w <- c(0,0,0,0)
  b <- 0
  len <- length(y)
  i <- 1
  while (i<=len){
    if(y[i]*(x[i,]%*%w+b)<=0){
      ## update w and b
      w <- w+delta*y[i]*x[i,]
      b <- b+delta*y[i]
      i <- 1
    }
      else{
      i <- i+1
      }
    }
    return(list(w=w,b=b))
  }
  
  
w <- PLA(data=as.matrix(temp),delta=1)
w

  1. Coursera台大机器学习基础课程学习笔记1 – 机器学习定义及PLA算法 ↩︎

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值