机器学习算法整理(五)决策树_随机森林——鹃尾花实例 Python实现

本文介绍了使用Python实现鸢尾花数据集上的决策树和随机森林算法。首先展示了鸢尾花三个种类的分布情况,接着划分了训练集和测试集,最后构建并应用了决策树模型。
摘要由CSDN通过智能技术生成

机器学习算法整理(五)决策树_随机森林——鹃尾花实例 Python实现

以下均为自己看视频做的笔记,自用,侵删!

还参考了:http://www.ai-start.com/ml2014/

In [8]:
%matplotlib inline
import pandas as pd
import matplotlib.pylab as plt

iris_data = pd.read_csv('iris.data')
iris_data.columns = ['sepal_length_cm', 'sepal_width_cm', 'petal_length_cm', 'petal_width_cm', 'class']
iris_data.head()
Out[8]:
  sepal_length_cm sepal_width_cm petal_length_cm petal_width_cm class
0 4.9 3.0 1.4 0.2 Iris-setosa
1 4.7 3.2 1.3 0.2 Iris-setosa
2 4.6 3.1 1.5 0.2 Iris-setosa
3 5.0 3.6 1.4 0.2 Iris-setosa
4 5.4 3.9 1.7 0.4 Iris-setosa
In [9]:
from PIL import Image
img = Image.open('test.jpg')
plt.imshow(img)
plt.show()
In [10]:
iris_data.describe()
Out[10]:
  sepal_length_cm sepal_width_cm petal_length_cm petal_width_cm
count 149.000000 149.000000 149.000000 149.000000
mean 5.848322 3.051007 3.774497 1.205369
std 0.828594 0.433499 1.759651 0.761292
min 4.300000 2.000000 1.000000 0.100000
25% 5.100000 2.800000 1.600000 0.300000
50% 5.800000 3.000000 4.400000 1.300000
75% 6.400000 3.300000 5.100000 1.800000
max 7.900000 4.400000 6.900000 2.500000
 

画出每个种类的分布

In [12]:
%matplotlib inline

import matplotlib.pyplot as plt
import seaborn as sb

# pairplot传入的数据不能有缺失值
sb.pairplot(iris_data.dropna(), hue='class
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值