【一起来啃西瓜书】——线性模型

最新推荐文章于 2024-05-18 11:05:50 发布

Mr_Nobody17

最新推荐文章于 2024-05-18 11:05:50 发布

阅读量416

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/mr_nobody17/article/details/122474835

版权

机器学习专栏收录该内容

5 篇文章 2 订阅

订阅专栏

1.基本形式

在这里插入图片描述

2.线性回归

1）输入一维，输出一维

在这里插入图片描述

2）输入多维，输出一维

在这里插入图片描述

3）输入多维，输出多维

在这里插入图片描述

4）广义线性模型

在这里插入图片描述

3.对数几率回归

在这里插入图片描述

4.线性判别分析

在这里插入图片描述

5.多分类学习

在这里插入图片描述

6.类别不平衡问题

在这里插入图片描述


# 导入包
from sklearn.datasets import make_classification
from collections import Counter
from imblearn.over_sampling import RandomOverSampler
# 生成样本集，用于分类算法：3类，5000个样本，特征维度为2
X, y = make_classification(n_samples=5000, n_features=2, n_informative=2,
                           n_redundant=0, n_repeated=0, n_classes=3,
                           n_clusters_per_class=1,
                           weights=[0.01, 0.05, 0.94],
                           class_sep=0.8, random_state=0)

# 打印每个类别样本数
print(Counter(y))


# 过采样
ros = RandomOverSampler(random_state=0)
X_resampled, y_resampled = ros.fit_resample(X, y)

# 打印过采样后每个类别样本数
print(sorted(Counter(y_resampled).items()))

在这里插入图片描述


# 导入包
from imblearn.over_sampling import SMOTE

# 过采样
sm = SMOTE(random_state=42)
X_res, y_res = sm.fit_resample(X, y)

# 打印过采样后每个类别样本数
print('Resampled dataset shape %s' % Counter(y_res))

在这里插入图片描述


# 导入包
from imblearn.under_sampling import RandomUnderSampler

# 欠采样
rus = RandomUnderSampler(random_state=0)
X_resampled, y_resampled = rus.fit_resample(X, y)

# 打印欠采样后每个类别样本数
print(sorted(Counter(y_resampled).items()))

在这里插入图片描述


# 导入包
from imblearn.combine import SMOTEENN
# 过采样与欠采样结合
smote_enn = SMOTEENN(random_state=0)
X_resampled, y_resampled = smote_enn.fit_resample(X, y)
# 打印采样后每个类别样本数
print(sorted(Counter(y_resampled).items()))


# 导入包
from imblearn.combine import SMOTETomek
# 过采样与欠采样结合
smote_tomek = SMOTETomek(random_state=0)
X_resampled, y_resampled = smote_tomek.fit_resample(X, y)
# 打印采样后每个类别样本数
print(sorted(Counter(y_resampled).items()))

在这里插入图片描述


# 导入相关包
from sklearn.svm import SVC

# 添加惩罚项
clf = SVC(C=0.8, probability=True, class_weight={0:0.25, 1:0.75})

在这里插入图片描述

Mr_Nobody17

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【一起来啃西瓜书】——线性模型

1.基本形式2.线性回归1）输入一维，输出一维2）输入多维，输出一维3）输入多维，输出多维4）广义线性模型3.对数几率回归4.线性判别分析5.多分类学习6.类别不平衡问题# 导入包from sklearn.datasets import make_classificationfrom collections import Counterfrom imblearn.over_sampling import RandomOverSampler# 生成样本集，
复制链接

扫一扫