01 sklearn基础操作笔记(sklearn.datasets)

01 sklearn基础操作笔记(sklearn.datasets)

一、加载iris鸢尾花数据集

1.加载iris鸢尾花数据集

 #加载iris数据集
from sklearn.datasets import load_iris
iris = load_iris()

在这里插入图片描述

2.打印iris鸢尾花数据集

#所在位置最后一行
print(iris)

在这里插入图片描述

3.iris鸢尾花数据的特征值

iris.keys()
iris.target #标签
iris.target_names #类别名称
iris.data #iris['data']

在这里插入图片描述

4.查看iris鸢尾花数据集的特征值的名字

iris.feature_names
#查看iris鸢尾花数据集的特征值的名字

在这里插入图片描述

5.了解iris鸢尾花数据今年情况

print(iris.DESCR)
#了解数据今年情况

在这里插入图片描述

二、加载boston数据集

from sklearn.datasets import load_boston
boston = load_boston()

boston.keys()
boston.feature_names

在这里插入图片描述

三、sklearn 三板斧(适用于驼峰命名的类):

  • 实例化
  • fit
  • transform or predict
    (驼峰命名原则:每个单词首字母大写)

例题:

1.实例化

from sklearn.tree import DecisionTreeClassifier
my_tree = DecisionTreeClassifier(max_depth = 3)
my_tree.get_params()

在这里插入图片描述

#修改参数值
my_tree.set_params(min_samples_leaf = 10)
#查看修改后的参数值
my_tree.get_params()

在这里插入图片描述

2.训练 fit

x = iris.data
y = iris.target
my_tree.fit(x,y)

#预测或评估
y1 = my_tree.predict(x)

my_tree.score(x,y)

在这里插入图片描述

my_tree.max_features_

#可用于特征选择
my_tree.feature_importances_

#Attributes为属性
#random_state为随机种子
help(DecisionTreeClassifier)

在这里插入图片描述

3.fit + transform or predict

#导入数据标椎库
from sklearn.preprocessing import StandardScaler

#实例化
std = StandardScaler(copy = False)#默认服从正态分布

import pandas as pd
bos_df = pd.DataFrame(boston.data, columns = boston.feature_names)

bos_df

在这里插入图片描述

#fit
std.fit(bos_df)

#transform
std.transform(bos_df)

在这里插入图片描述

# fit和transform可以一步完成
bos2 = std.fit_transform(bos_df)

#每一列均值
std.mean_
#每一列方差
std.var_

在这里插入图片描述

bos_df
bos2

#重新加载boston数据
boston = load_boston()
boston.data

在这里插入图片描述在这里插入图片描述

scale和SklearnScaler的区别:

与SklearnScaler功能相同的标准化函数:scale
处理多个数据集用SklearnScaler**

from sklearn.preprocessing import scale

x1 = scale(boston.data, axis =1)
#axis = 0,按列标准化
#axis = 1,按行标准化

x1

在这里插入图片描述

四、模型的保存——“持久化”

import joblib
joblib.dump(my_tree,'ddd.pkl')

#模型保存和使用
import joblib

my_tree1 = joblib.load("ddd.pkl")

from sklearn.datasets import load_iris
iris = load_iris()
my_tree1.predict(iris.data)

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
根据引用和引用的描述,出现"No module named 'sklearn'"的错误可能是由于缺少scikit-learn库导致的。解决这个问题的方法是安装scikit-learn库。引用中提到,如果直接在anaconda prompt中安装scikit-learn,它会被安装在默认目录下,但不一定是当前项目解释器所在的目录。为了确保scikit-learn被安装在正确的环境中,你可以先激活你的项目环境,然后在该环境下安装scikit-learn。 具体操作步骤如下: 1. 打开Anaconda Prompt。 2. 输入命令"conda activate 你的项目环境名称",激活你的项目环境。 3. 确保你的项目环境已激活后,在Anaconda Prompt中输入命令"conda install scikit-learn",安装scikit-learn库。 4. 等待安装完成后,再次运行你的代码,应该不会再出现"No module named 'sklearn'"的错误。 通过按照上述步骤在正确的环境中安装scikit-learn库,你应该能够成功导入"from sklearn import datasets"而不再遇到ModuleNotFoundError错误。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [笔记:pycharm中ModuleNotFoundError:No Module named ‘sklearn‘ 解决办法](https://blog.csdn.net/qq_41786932/article/details/105125955)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [PyCharm中解决ModuleNotFoundError: No module named ‘sklearn’和 No module named ‘pandas’问题](https://blog.csdn.net/weixin_51589360/article/details/127135395)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值