系列文章目录
一、莺尾花Iris数据集长什么样?
1、读取本地数据集
读取本地数据集Iris
import pandas as pd
df = pd.read_csv('C:/Users/lzc/Desktop/机器学习/利用python进行数据分析/pydata-book-2nd-edition/pydata-book-2nd-edition/iris-data.csv',nrows=5)
#注意C:/Users/lzc/Desktop/机器学习/利用python进行数据分析/pydata-book-2nd-edition/pydata-book-2nd-edition/iris-data.csv是你下载好的数据集的位置。nrows=5表示读取5行。
df
#df.head()
x = df.iloc[:, 0:4].values
#x = df.iloc[:, :-1].values
#第一个冒号表示提取数据集的全部行,「:-1」则表示提取除最后一列以外的所有列。最后的「.values」表示希望提取所有的值。
y = df.iloc[:, 4].values
print(x)#输出特征
print(y)#输出Class
2、
import numpy as np #Load the numpy library for fast array computations
import pandas as pd #Load the pandas data-analysis library
import matplotlib.pyplot as plt #Load the pyplot visualization library
%matplotlib inline
from sklearn import datasets
iris = datasets.load_iris()
iris_df = pd.DataFrame(iris.data, columns = iris.feature_names)
iris_df['sepal length (cm)'].hist(bins=10)#读取sepal length这一列的10行(个)数据
二、Scikit-learn实现机器学习
1.基本实现
#导包
from __future__ import print_function
from sklearn import data