Datawhale202401组队吃瓜——第二次打卡

机器学习(西瓜书),第3章,线性模型

一、线性回归

此部分直接回顾高等数学最小二乘法,先是定义损失函数(均方误差),为了使其最小,将损失函数对两个变量\omegab分别求偏导,偏导都为0的地方是最小值(必要条件),严格来说还要对二阶偏导的Hessian矩阵判断正定。

多维空间原理相似,仅均方误差变为(y-X\hat{w})^T*(y-X\hat{w}),直观理解就是向量内积的形式,而向量内积类似于到原点的欧几里得距离的平方,便隐含了“距离”的概念。

X=[x_1,x_2,x_3]^T,则

X^T \cdot X = \begin{bmatrix} x_1 & x_2 & x_3 \end{bmatrix} \cdot \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix}=x_1^2+x_2^2+x_3^2

为距离的平方

参考调用sklearn代码

#导入包
import numpy as np  #
from sklearn.linear_model import LinearRegression  
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置中文显示
plt.rcParams['axes.unicode_minus'] = False  # 解决符号显示问题

#创建数据
x = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)  # 自变量数据
y = np.array([1, 4, 8, 10, 11]).reshape(-1, 1)  # 因变量数据

#构建线性模型
model = LinearRegression()  # 创建一个回归分析对象
model.fit(x.reshape(-1, 1), y.reshape(-1, 1))  # 对x和y进行拟合

#获取系数和截距
print('系数:', model.coef_[0],'截距:', model.intercept_)

# 可视化
plt.scatter(x, y, color='blue', label='实际数据')
plt.plot(x, model.predict(x), color='red', label='线性回归模型')
plt.title('线性回归示例')
plt.xlabel('自变量')
plt.ylabel('因变量')
plt.legend()
plt.show()

效果图

二、对数几率回归

将乘法问题转化为加法问题,大大降低了计算的复杂度,其核心就为数理统计中的,利用已知数据结果,反推最具有可能(极大似然)导致这些样本结果出现的模型参数值
中提到牛顿法,推荐看这个可视化过程的b站视频【【机器学习】动画讲解牛顿法】https://www.bilibili.com/video/BV17u4y1Q7wB/

三、多问题学习

最经典的拆分策略有三种. "一对一" (One vs. One ,简称 OvO) ,"一对 其余" (One vs. Rest ,简称 OvR) 和"多对多" (Many vs. Many,简称 MvM).

多分类中的编码属实是一个有趣的想法,将多问题变为多个01位的二分类问题

四、不平衡问题

欠采样:丢弃了很多多出的例子,代表性算法 EasyEnsemble [Liu et 此, 2009] 则是利用集成学习机制,将反倒划分为若干个 集合供不同学习器使用,这样对每个学习器来看都进行了欠采样,但在全局来 看却不会丢失重要信息.
过采样:SMOTE [Chawla et al., 2002] 通过对训练集里的正例进行插值来产生额外的正例
阈值移动:即讲预测阈值设定在原有的比例上,比如正例(数值1)80个,反例(数值0)20个,只有预测值映射在[0,1],只有预测值大于0.8,才认为是正例。而不是简单的用0.5作为分类阈值
 

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值