【Abee】吃掉西瓜——西瓜书学习笔记（二）

最新推荐文章于 2020-01-18 18:12:45 发布

AnyaBee

最新推荐文章于 2020-01-18 18:12:45 发布

阅读量181

点赞数

分类专栏：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40006612/article/details/89216013

版权

python 同时被 2 个专栏收录

15 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

线性模型(linear model)

目录

【内容包含第三章】

线性回归（linear regression）

多元线性回归（multivariate linear regression）

对数几率函数（logistic function）

线性判别分析（Linear Discriminant Analysis，LDA）

多分类学习

类别不平衡（clss-imbalance）

线性回归（linear regression）

向量形式

$f(x)=w^{T}x+b$

实际上我们遇到的数据分类并不都是数值类型的，对有序离散数据可以转化为数值比如身高高、中、矮（1.0），（0.5），（0），对于属性间无序的数据，可以转化为k维向量，如西瓜，黄瓜（1,0）（0,1）

均方差：常用性能度量

最小二乘法：使用均方差对线性模型进行求解

$(w^{*},b^{*})=arg min\sum_{i=1}^{m}(f(x_{i})-y_{i})$

多元线性回归（multivariate linear regression）

最小二乘法

$\hat{w}^{*}=arg min(y-X\hat{w})^{T}(y-X\hat{w})$

线性回归模型 ( $X^{T}X$ 为满秩矩阵时）

$f(\hat{x})=\hat{x}^{T}(X^{T}X)^{-1}X^{T}y$

还有对数线性回归，广义线性模型等衍生

$y=g^{-1}(w^{T}x+b)$

其中g（）为联系函数（link function），要求连续且充分光滑

对数几率函数（logistic function）

这个引入是考虑二分类模型预测值为0,1，然而阶跃函数并不连续，因此用对数几率函数替代它

$y=\frac{1}{1+e^{-z}}$

对数几率函数是一个Sigmoid函数，对应的线性回归模型为

$ln\frac{y}{1-y}=w^{T}x+b$

可以进一步通过极大似然法估计w和b

线性判别分析（Linear Discriminant Analysis，LDA）

也称为Fisher判别

主要思想：将样例投影到一条直线上，使类内投影尽可能接近，类间投影尽可能远离

即最大化目标J

$J=\frac{w^{T}(\mu _{0}-\mu _{1})(\mu _{0}-\mu _{1})w}{w^{T}(\sum _{0}+\sum _{1})w}$

类内散度矩阵

$S_{w}=\sum {_{0}}^{}+\sum {_{1}}^{}$

类间散度矩阵

$S_{b}=(\mu _{0}-\mu _{1})(\mu _{0}-\mu _{1})^{T}$

多分类学习

可以将多分类任务拆解成多个二分类任务，再进行集成

假设存在N个类别

一对一（OvO）: N(N-1)/2 次两两配对，然后投票决定

一对其余（OvR）:N个分类器

多对多（MvM）: 举例，ECOC 纠错输出码

类别不平衡（clss-imbalance）

通过再缩放（rescaling）（要求训练集为样本总体的无偏采样）

$\frac{y'}{1-y'}=\frac{y}{1-y}\times \frac{m^{-}}{m^{+}}$

也可以用 $\frac{cost^{-}}{cost^{+}}$ 替换 $\frac{m^{-}}{m^{+}}$ 来进行代价敏感学习（cost-sensitive learning）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Abee】吃掉西瓜——西瓜书学习笔记（二）

线性模型(linear model)目录【内容包含第三章】线性回归（linear regression）多元线性回归（multivariate linear regression）对数几率函数（logistic function）线性判别分析（Linear Discriminant Analysis，LDA）多分类学习类别不平衡（clss-imbalance...
复制链接

扫一扫

专栏目录

AnyaBee CSDN认证博客专家 CSDN认证企业博客

码龄7年

24: 原创

11万+: 周排名

141万+: 总排名

5万+: 访问

: 等级

648: 积分

11: 粉丝

39: 获赞

17: 评论

131: 收藏

私信

关注

分类专栏

macos 1篇
图像处理 1篇
numpy 1篇
矩阵乘法 2篇
相关系数 1篇
matlab 1篇
ubuntu 3篇
机器学习 8篇
python 15篇
数据可视化
医学影像 4篇

最新评论

【FreeSurfer】mgz和nii.gz数据类型转换
AnyaBee: 可能是写入权限问题，你从这个角度试试看
【FreeSurfer】mgz和nii.gz数据类型转换
Dazhuzhuming: 你好，我使用这个api报错如下，请问是什么问题呢 (base) cheng@LAPTOP-RGM3GCF3:~/eeg/data$ mri_convert sample.nii sample.mgz mri_convert sample.nii sample.mgz reading from sample.nii... TR=1000.00, TE=0.00, TI=0.00, flip angle=0.00 i_ras = (-1, 0, 0) j_ras = (0, 1, 0) k_ras = (0, 0, 1) writing to sample.mgz... error: mghWrite(sample.mgz, -1): could not open file ERROR: failure writing sample.mgz
【医学影像】如何无信息损失的读取、处理和保存nii文件（python，nibabel）
AnyaBee: 你对data是不是进行了改动？.gz这个压缩方式在数据内容不同的情况下大小是不一样的
【医学影像】如何无信息损失的读取、处理和保存nii文件（python，nibabel）
liurui666666: 我用您的方法试了一下，读入的nii.gz文件是71817byte，重新保存的文件是68322byte，说明还是有损，问题出在哪里呢？
【医学影像】如何无信息损失的读取、处理和保存nii文件（python，nibabel）
qajhdj: 你copy affine时用的memmap可能是getdata得到的，此处应该用load进来的nii图像

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。