machine learning基础知识(Leetcode)

机器学习

machine learning是机器通过已知的内容,类似于人类一样进行学习,并对同类型数据进行判断的过程。
例如训练图片模型就是将每个像素点转为0到255之间的值,利用机器发现不同种类的图片之间存在的映射。

有监督与无监督模型

  • 监督学习是F(x)= sum 并且sum已知,可以通过已知的属性进行预测,而且目标函数需要带有“label”。
  • 无监督学习。通过数据的潜在的模式和规则,无需预定义,并且同过“聚类”、“关联”等发现数据中的隐藏的关系。

半监督学习

  • 结合有监督与无监督同时进行学习,其中有少部分数据又“label”,没有label的数据可以进行无监督学习进行分类。

分类与回归(classification and regression)

  • 分类,如下图,以布尔值的形式进行区别不同的类
  • 公式表达为: F(M[H][W])=1∣0,where M[i][j]∈[0,255],0<i<H,0<j<W
    在这里插入图片描述
  • 回归模型: 如下图,横坐标代表房子的面积,纵坐标表示价格。通过一个某事物的一个属性来预测另一个变量的方式叫Regression
  • decision tree可以直接处理非数字特征,但是通常使用one-hot将非数字的数据转换为另一个的方法。
    在这里插入图片描述
    使用Logistic Rgression来输出概率,可以结局分类的问题。

workflow:

  • raw data -> 数据分离,normalization 和 数据清理
  • training
  • test data
  • 超参数调整(Hyperparameter tuning)

将数据分为两组:训练集、测试集(一般比例为7:3,8:2,如果数据量特别大的话,可以分为9:1)

欠拟合与过拟合(underfitting and overfitting)
在这里插入图片描述

  1. 欠拟合:model没有找到规律(与实际情况相差很多)
  2. overfitting: 过渡于适应training data,甚至与noise也都适应了。解决方法:随机drop掉部分模型,和加入regularization的算法。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值