0727读书笔记--机器学习第三章线性模型

最新推荐文章于 2024-09-12 21:05:39 发布

m0_62713613

最新推荐文章于 2024-09-12 21:05:39 发布

阅读量367

点赞数 10

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/m0_62713613/article/details/131953006

版权

机器学习第三章线性模型读书笔记

3.1 基本形式

线性模型（Linear model）：试图学得一个通过属性的线性组合来进行预测的函数，即
f(x)=w1x1+w2x2+…+wdxd+b
w和b学得后，模型就确定了
非线性模型（nonlinear model）可在线性模型的基础上通过引入层级结构或高维映射而得。
线性模型具有很好的可解释性

3.2 线性回归

线性回归（linear regression）试图学一个线性模型以尽可能地预测实值输出标记。
对数线性回归（long-linear）在形式上仍是线性回归，实质上已是在求取输入空间到输出空间的非线性函数映射。lny=wTx+b
广义线性模型（generalized linear model）:y=g-1(wTx+b)
g(.)称为联系函数（link function）

3.3 对数几率回归

线性模型可进行回归学习，但若任务是分类该如何？找一个单调可微函数将分类任务的真实标记y与线性回归模型的预测值联系起来。
Heaviside函数
线性回归预测值是实值
单位阶跃函数（unit-step function）是不连续的不能作g(.) ,在一定程度上近似单位阶跃函数的替代函数（surrogate function）并可微—对数几率函数（logistic function）(可作g(.)）
几率（odds）反映了x作为正例的相对可能性，y/(1-y)
对数几率（log odds，即logit） ln[y/(1-y)]
对数几率回归（logistic regression,即logit regression）
极大似然法（maximum likelihood method）

3.4 线性判别分析

LDA(Linear Discriminant Analysis)也称Fisher 判别分析
思想：给定训练样例集，设法让样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样例点尽可能远离；对新样本进行分类时，将其同样投影到此直线，根据投影点位置确定新样本的类别。
类间散度矩阵（between-class sactter matrix）
广义瑞利商（generalized Rayleigh quotient）

3.5 多分类学习

分类器分类学习器
拆分策略：一对一 OvO
一堆其余 OvR
多对多 MvM

3.6 类别不平衡问题

class-imbalance ,指分类任务中不同类别的训练样例数目差别很大时，不失一般性。
再缩放rescaling（再平衡rebalance）思想—代价敏感学习（cost-sensitive learning)的基础
现有三类技术做法
1.直接对训练集里的反类样例进行欠采样（undersampling）即去除反例使得正、反例数目接近再学习
2.对训练集里的正类样例进行过采样（oversampling),即增加一些正例使得正反例数目接近再学习
3.直接基于原始训练集进行学习，但在用训练好的分类器进行预测时将y*/(1-y*)=y/(1-y)*m-/m+式嵌入到其决策中，称为阈值移动（threshold-moving）.

3.7 阅读材料

稀疏表示 sparse representation
稀疏性 sparsity
ECOC 编码法、DAG(Directed Acyclic Graph)拆分法
误分类代价misclassification cost
多标记学习 multi-label learning

欢迎使用Markdown编辑器

你好！这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：

全新的界面设计 ，将会带来全新的写作体验；
在创作中心设置你喜爱的代码高亮样式，Markdown 将代码片显示选择的高亮样式 进行展示；
增加了 图片拖拽 功能，你可以将本地的图片直接拖拽到编辑区域直接展示；
全新的 KaTeX数学公式 语法；
增加了支持甘特图的mermaid语法¹ 功能；
增加了 多屏幕编辑 Markdown文章功能；
增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能，功能按钮位于编辑区域与预览区域中间；
增加了 检查列表 功能。

功能快捷键

撤销：Ctrl/Command + Z
重做：Ctrl/Command + Y
加粗：Ctrl/Command + B
斜体：Ctrl/Command + I
标题：Ctrl/Command + Shift + H
无序列表：Ctrl/Command + Shift + U
有序列表：Ctrl/Command + Shift + O
检查列表：Ctrl/Command + Shift + C
插入代码：Ctrl/Command + Shift + K
插入链接：Ctrl/Command + Shift + L
插入图片：Ctrl/Command + Shift + G
查找：Ctrl/Command + F
替换：Ctrl/Command + G

合理的创建标题，有助于目录的生成

直接输入1次#，并按下space后，将生成1级标题。
输入2次#，并按下space后，将生成2级标题。
以此类推，我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

~~删除文本~~

引用文本

H₂O is是液体。

2¹⁰ 运算结果是 1024.

插入链接与图片

链接: link.

图片: Alt

带尺寸的图片:

居中的图片: Alt

居中并且带尺寸的图片:

当然，我们为了让用户更加便捷，我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

去博客设置页面，选择一款你喜欢的代码片高亮样式，下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

项目
- 项目
  - 项目

项目1
项目2
项目3

计划任务
完成任务

创建一个表格

一个简单的表格是这么创建的：

项目	Value
电脑	$1600
手机	$12
导管	$1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列	第二列	第三列
第一列文本居中	第二列文本居右	第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如：

TYPE	ASCII	HTML
Single backticks	`'Isn't this fun?'`	‘Isn’t this fun?’
Quotes	`"Isn't this fun?"`	“Isn’t this fun?”
Dashes	`-- is en-dash, --- is em-dash`	– is en-dash, — is em-dash