机器学习

机器学习

sklearn基础功能

  1. 主要使用python的sklearn库:sklearn库共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理。
  2. 各模块功能介绍
    分类任务
    分类模型加载模块
    最近邻算法neighbors.NearestNeighbors
    支持向量机svw.SVC
    朴素贝叶斯naive_bayes.GaussianNB
    决策树tree.DecisionTreeClassifier
    集成方法ensemble.BaggingClassifier
    神经网络neural_network.MLPClassifier
    回归任务
    回归模型加载模块
    岭回归linear_model.Ridge

    Lasso回归

    linear_model.Lasso
    弹性网络linear_model.ElasticNet
    最小角回归linear_model.Lars
    贝叶斯回归linear_model.BayesianRidge
    逻辑回归linear_model.LogisticRegression
    多项式回归preprocessing.PolynomialFeatures
    聚类任务
    聚类方法加载模块
    K-meanscluster.KMeans
    AP聚类cluster.AffinityPropagation
    均值漂移cluster.MeanShift
    层次聚类cluster.AgglomerativeClustering
    DBSCANcluster.DBSCAN
    BIRCHcluster.Birch
    谱聚类cluster.SpectralClustering
    降维任务
    降维方法加载模块
    主成分分析decomposition.PCA
    截断SVD和LSAdecomposition.TruncatedSVD
    字典学习decomposition.SparseCoder
    因子分析decomposition.FactorAnalysis
    独立成分分析decomposition.FastICA
    非负矩阵分解decomposition.NMF
    LDAdecomposition.LatentDirichletAllocation
  3. 通过sklearn库自带的数据集学习模拟应用
    1. 手写数字数据集
      #手写数字数据集
      from sklearn.datasets import load_digits
      digits=load_digits()
      '''
      #加载数据集,
      #参数:
          return_X_y:若为True,则以(data,target)形式返回,
              默认为False,表示以字典形式返回数据全部信息(data和target)
          n_class:表示返回数据的类别数,
      '''
      print(digits.data.shape)    #打印数据维度
      print(digits.target.shape)
      print(digits.images.shape)  
      
      import matplotlib.pyplot as plt#显示图片
      plt.matshow(digits.images[0])
      plt.show()

    2. 鸢尾花数据集
      '''
      鸢尾花数据集
          1.数据为鸢尾花的测量数据及其所属的类别,包括萼片长度,萼片宽度
              花瓣长度,花瓣宽度,共分为三类,Iris Setosa,Iris Versicolour,
              Iris Virginica,可用于多分类问题。
          2.load_iris()函数参数:
              return_X_y:若为True,则以(data,target)形式返回is
              默认为False,表示以字典形式返回数据全部信息(data和target)
          n_class:表示返回数据的类别数
      '''
      from sklearn.datasets import load_iris
      iris=load_iris()
      print(iris.data.shape)
      
      print(iris.data.shape)
      print(iris.target.shape)
      print(list(iris.target_names))

       

    3. 波士顿房价数据集,可以应用到回归问题上。
      #波斯顿房价数据集
      from sklearn.datasets import load_boston
      '''
          2.load_boston()函数参数:
              return_X_y:若为True,则以(data,target)形式返回is
              默认为False,表示以字典形式返回数据全部信息(data和target)
      '''
      boston=load_boston()
      print(boston.data.shape)
      
      bostondata,bostontarget=load_boston(return_X_y=True)
      print(bostondata.shape)
      print(bostontarget.shape)
       
  4.  数据集总览
    总览
     数据集名称调用方式适用算法数据规模

    波士顿房价数据集load_boston()回归506*13
    鸢尾花数据集load_iris()分类150*4
    糖尿病数据集load_diabetes()回归442*10
    手写数字数据集load_digits()分类5620*64

    Olivetti脸部图像数据fetch_olivetti_faces()降维400*64*64
    新闻分类数据集fetch_20newsgroups()分类-
    带标签的人脸数据集fetch_lfw_people()分类;降维-
    路透社新闻语料数据集fetch_rcvl()分类804414*47236

     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

秘境之眼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值