Sklearn学习笔记-概述+数据预处理


前言

这个学期我们开始学习数据挖掘了,准备在csdn上记录一些学习笔记。

实验课是从sklearn数据库开始的。第一次实验课,以鸢尾花(iris)数据集和波士顿房价数据集以及手写数字数据集为例,学习了一些基本概述和数据预处理的相关命令。

 

一、鸢尾花(iris)数据集

1.导入并加载数据集  

#导入iris库
from sklearn.datasets import load_iris
#加载iris数据库
iris = load_iris()
iris

输出结果如下:

 

2.一些基本命令

iris.keys()
#以字典的形式返回
iris.filename
#数据集所在位置
print(iris.DESCR)
#对数据集的介绍
iris.target_names
#目标变量名
iris.feature_names
#列名称
iris.data
#等价于iris['data']

3.将数据集转为数据框

#转为数据框
import pandas as pd
iris_df = pd.DataFrame(iris.data,columns = iris.feature_names)
iris_df

结果如下:

 

#增加数据框的列
iris_df['class']= iris.target
iris_df

结果如下:

 

二、波士顿房价数据集

1.导入并加载数据集

from sklearn import datasets
boston = datasets.load_boston()
boston

结果如下:

 

2.一些基本命令

 

boston.keys()
#以字典的形式返回
boston.filename
#数据集所在位置
print(boston.DESCR)
#对数据集的介绍
boston.target_names
#目标变量名
boston.feature_names
#列名称
boston.data
#等价于iris['data']

3.将数据集转为数据框

 
import pandas as pd
boston_df = pd.DataFrame(boston.data,columns = boston.feature_names)
boston_df.head(20)

结果如下:

 

 


三、手写数字数据集

手写数字数据集包括1797个数字数据,每个数字由8 * 8的矩阵组成

1.导入并加载数据集

from sklearn.datasets import load_digits
digit=load_digits()
digit

结果如下(部分):

 

2.一些基本命令

digit.keys()

结果:

digit.images.shape

 结果:

 

digit.images[0]

结果:

 

digit.target[1700]

结果:

%matplotlib inline
import matplotlib.pyplot as plt
plt.matshow(digit.images[1700])

 结果:

digit.data

 结果:

四、sklearn"三板斧“

实例化-->fit(训练)-->transforms or predict(转化/预测)

from sklearn import preprocessing#预处理
std = preprocessing.StandardScaler()#实例化
std.fit(boston.data)

结果:

#期望
std.mean_

 结果:

 

#方差
std.var_

结果:

std.transform(boston.data)#转化

 结果:

 

#合二为一
std.fit_transform(boston.data)

结果:

 

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Suki百香果

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值