机器学习(二)之python调用scikit learn

本文介绍了如何使用Python的scikit-learn库进行机器学习数据预处理,特别是针对鸢尾花数据集(Iris dataset)。首先讲解了scikit-learn的基本概念,然后详细阐述了加载和打印Iris数据集的过程,包括数据的属性和类别信息。在Jupyter环境中,通过load_iris方法加载数据,并展示了数据的类型和维度。最后,将数据集的特征和目标变量分别赋值为X和Y。
摘要由CSDN通过智能技术生成

        上一篇博客写了机器学习开发环境的部署,这次针对机器学习数据预处理进行记录,利用的是scikit-learn中自带的iris数据——鸢尾属植物数据(分类)。包括如何加载打印和赋值

        首先介绍一下scikit-learn是什么:

  • scikit-learn 是基于 Python 语言的机器学习工具。

  • 简单高效的数据挖掘和数据分析工具

  • 可供大家在各种环境中重复使用

  • 建立在 NumPy ,SciPy 和 matplotlib 上 

        其次iris是一类多重变量分析的数据集。

  • 包含三类供150条记录,每条记录有四个属性。

  • 分别是花萼长度,花萼宽度,花瓣长度,花瓣宽度。

  • 通过这4个属性可以预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。         

        接下来就是在jupyter中进行iris数据的预处理。

首先打开Anaconda,点击jupyter,new一个python3.

使用load_iris 方法加载iris数据集:

  • from sklearn import datasets

  • iris=datasets.load_iris()

print输出iris.data可以看到多个记录值,每个记录包含前面提到的四个属性。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值