百度机器学习 课程 02

6 篇文章 0 订阅
5 篇文章 0 订阅

01 机器学习原理与背景

1、机器学习分类:

在这里插入图片描述
有监督学习: 有标签的数据
无监督学习:无标签的学习(如:聚类算法)——探索杂乱的数据内部的规律
在这里插入图片描述
在nlp里面,词向量模块:
在这里插入图片描述

强化学习:定义了环境,agent,动作,奖励。通过与环境进行交互得到奖励,经过若干次迭代后学习到规律
在这里插入图片描述

输入,输出,评价指标

2、回归与分类

1) 线性回归

在这里插入图片描述
训练过程:
在这里插入图片描述
拓展到多元线性回归:
在这里插入图片描述

2) 代码实战

from numpy import *
import matplotlib.pylab as plt

加载数据:

def loadDataSet(filename):
    datamat=[]
    labelmat=[]
    fr=open(filename)
    for line in fr.readlines():
         lineArr=[]
         curline=line.strop().split('\t')
         for i in range(2):
              lineArr.append(float(curLine[i]))
              dataMat.append(lineArr)
              labelMat.append(float(curLine[-1]))
     return dataMat,labelMat

矩阵计算:
在这里插入图片描述
对应的代码如下:

def starRegres(xArr,yArr):
     xMat=mat(xArr)
     yMat=mat(yArr).T
     xTx=xMat.T*xMat
     if linalg.det(xTx)==0:
        return 
     ws=xTx.I*(xMat.T *yMat)
     return ws

最后画图:

def regression1():
    xArr, yArr = loadDataSet("./data/data.txt")
    xMat = mat(xArr)
    yMat = mat(yArr)
    ws = standRegres(xArr, yArr)
    fig = plt.figure()
    ax = fig.add_subplot(111)               #add_subplot(349)函数的参数的意思是,将画布分成3行4列图像画在从左到右从上到下第9块
    ax.scatter(xMat[:, 1].flatten().tolist(), yMat.T[:, 0].flatten().A[0].tolist()) #scatter 的x是xMat中的第二列,y是yMat的第一列
    xCopy = xMat.copy()
    xCopy.sort(0)
    yHat = xCopy * ws
    ax.plot(xCopy[:, 1], yHat)
    plt.show()

在这里插入图片描述

3)简单回归

1、逻辑回归

在这里插入图片描述
损失函数:
使用极大似然函数:
值越大越好(采用梯度上升法)
在这里插入图片描述
在这里插入图片描述

3 机器学习评价

1)模型过拟合与正则化

在这里插入图片描述
如何预防模型过拟合:
尽量避免参数过大,将参数约束在一定范围
数据归一化
在这里插入图片描述

2)数据集划分

在这里插入图片描述
在这里插入图片描述

3)机器学习评价体系

在这里插入图片描述
recall:召回率,类似于医学中的敏感度

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值