人工智能学习笔记

最新推荐文章于 2024-08-08 14:28:23 发布

Idealist_T

最新推荐文章于 2024-08-08 14:28:23 发布

阅读量230

点赞数

分类专栏：机器学习文章标签：人工智能学习机器学习

本文链接：https://blog.csdn.net/m0_57113834/article/details/127379948

版权

5 篇文章 0 订阅

订阅专栏

机器学习初探（第二波~）

线性模型的优点

目的：

学习、以获得一个线性模型以尽可能准确地预测实值输出标记
离散属性处理
- 若有“序”，连续化为连续值
- 若无“序”
  - 有K个属性值，则转换为K维向量
  - 若将无序属性连续化，则会不恰当地引入序关系，对后续处理造成误导
单一属性的线性回归目标
- 参数/模型估计：最小二乘法——最小化均方误差
多元线性回归
- 最小二乘法
- 满秩讨论
  
  当回归模型中
  $X^TX$
  不是满秩矩阵时：
  - 根据归纳偏好选择解
  - 引入正则化

一般形式：
$y=g^-1(w^Tx+b)$
联系函数：单调可微

预测值与输出标记
$z=w^Tx+b \\y∈{0，1}$
寻找函数将分类标记与线性回归模型输出联系起来
- 最理想的函数——单位阶跃函数
  - 缺点：不连续，不能直接用作联系函数
  - 寻找一个符合条件的i带函数 对数几率函数
    - 单调可谓，任意阶可导

对数几率

若将y视作样本x作为正例的可能性，则1-y作为其反例的可能性，两者的比值称为“几率”，反应了x作为正例的相对可能性，对几率取对数则得到“对数几率”，即x作为正例的相对可能性的对数
本质上是用线性回归模型的预测结果去逼近真实标记的对数几率；
“回归”——实际上是一种分类学习方法
优点：
- 直接对分类可能性进行建模，无需事先假设数据分布，避免了假设分布不准确带来的问题；
- 可得到“类别”的近似概率预测；
- 对数几率回归的目标函数是任意阶可导的凸函数，可直接应用现有数值优化算法求取最优解；
极大似然法

LDA是一种经典的线性学习方法，也可被视为一种监督降维技术。

思想：