Sklearn 学习笔记
文章平均质量分 77
针对skl各算法的使用进行复现
ACxz
共同努力、进步、开冲
展开
-
pandas.fillna()函数
DataFrame.fillna函数参数说明与操作实例原创 2022-06-10 12:02:15 · 4144 阅读 · 0 评论 -
基于Pytorch的Fashion mnist实战
import torchfrom torchvision import datasets, transformsimport timeimport numpy as npimport matplotlib.pyplot as plt from PIL import Image# Define a transform to normalize the datatransform = transforms.Compose([transforms.ToTensor(),原创 2022-04-26 20:04:52 · 4774 阅读 · 0 评论 -
分类算法评估
sklearn.metrics中对分类算法的评估方法1. Accuracy_score分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。形式:sklearn.metrics.accuracy_score(y_true, y_pred, normalize=True, sample_weight=None)normalize:默认值为True,返回正确分类的比例;如果为False,返回正确分类的原创 2021-11-26 09:28:57 · 1182 阅读 · 0 评论 -
回归模型评价
回归模型评价比较简单.因为都是连续值,直接观察预测值与实际值的误差就可以了.下面简单示例:导入包import numpy as npimport pandas as pdfrom sklearn.metrics importmean_absolute_error, mean_squared_error, r2_score输出各种评价指标y为真实值, predicted_y为预测值print(‘平均绝对误差:’, mean_absolute_error(y, predicted_y))原创 2021-11-29 19:29:10 · 1821 阅读 · 0 评论 -
利用随机森林,斯朴素贝叶斯,支持向量机对鸢尾花数据集进行分类和可视化
1. 导入所需要的库文件(准备阶段)import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom mpl_toolkits import mplot3dimport seaborn as snsimport warningswarnings.filterwarnings('ignore')plt.style.use('ggplot') plt.rcParams['font.sans-serif'] =原创 2021-11-26 09:58:59 · 2835 阅读 · 0 评论 -
高斯混合模型(GMM)
高斯混合模型k-means 聚类模型非常简单并且易于理解,但是它的简单性也为实际应用带来了挑战。特别是在实际应用中,k-means 的非概率性和它仅根据到簇中心点的距离来指派簇的特点将导致性能低下。这一节将介绍高斯混合模型,该模型可以被看作是k-means思想的一个扩展,但它也是一种非常强大的聚类评估工具。还是从标准导入开始:%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as sns; sns.set()imp原创 2021-11-28 15:37:26 · 8632 阅读 · 0 评论 -
决策树与随机森林(DecisionTree_RandomForest)
决策树与随机森林下面将介绍另一种强大的算法——无参数算法随机森林。随机森林是一种集成方法,通过集成多个比较简单的评估器形成累积效果。这种集成方法的学习效果经常出人意料,往往能超过各个组成部分的总和;也就是说,若干评估器的多数投票(majority vote)的最终效果往往优于单个评估器投票的效果!后面将通过示例来演示,首先还是导入标准的程序库:import requestsurl = 'https://mp3.jiuku.9ku.com/hot/2009/08-27/186947.mp3'原创 2021-11-28 16:30:42 · 11836 阅读 · 0 评论 -
SVM 算法
支持向量机支持向量机(support vector machine,SVM)是非常强大、灵活的有监督学习算法,既可用于分类,也可用于回归。在本节中,我们将介绍支持向量机的原理,并用它解决分类问题。首先还是导入需要用的程序库:%matplotlib inlineimport numpy as npimport matplotlib.pyplot as pltfrom scipy import stats#用Seaborn画图import seaborn as sns; sns.set()这里将原创 2021-11-28 16:04:20 · 693 阅读 · 0 评论 -
K_MEANS 聚类
k-means简介k-means 算法在不带标签的多维数据集中寻找确定数量的簇。最优的聚类结果需要符合以下两个假设。“簇中心点”(cluster center)是属于该簇的所有数据点坐标的算术平均值。一个簇的每个点到该簇中心点的距离,比到其他簇中心点的距离短。这两个假设是k-means 模型的基础,后面会具体介绍如何用该算法解决问题。先通过一个简单的数据集,看看k-means 算法的处理结果。首先,生成一个二维数据集,该数据集包含4 个明显的簇。由于要演示无监督算法,因此去除可视化图中的原创 2021-11-28 15:47:44 · 6514 阅读 · 0 评论