神经网络基础 - PyBrain机器学习包的使用
PyBrain = Python-Based Reinforcement Learning, Artificial Intelligence and Neural Network,是一个基于Python的以神经网络为核心的机器学习包。这里我们用它来实现一个基本的BP神经网络。
安装准备
PyBrain安装十分简单(只是要提前装好依赖包numpy,scipy,nose等):
由于PyBrain托管在GitHub上,可直接使用git命令来获取最新版本:
git clone git://github.com/pybrain/pybrain.git "指定路径"
进入指定路径,运行安装命令:
python setup.py install
安装可能需要权限。
更多安装信息可参考官方主页-Installation.
数据准备
这里我们采用UCI著名数据集Iris Data Set.
其数据集的简述如下:
输入:鸢尾花的四个属性(连续值)
1. sepal length in cm
2. sepal width in cm
3. petal length in cm
4. petal width in cm
输出:鸢尾花的品种(分类值)
-- Iris Setosa
-- Iris Versicolour
-- Iris Virginica
过程:由输入预测输出
其他:
样本量:150,每类样本量平均。
缺失值:无
下面是一些数据示例:
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
...
7.0,3.2,4.7,1.4,Iris-versicolor
6.4,3.2,4.5,1.5,Iris-versicolor
...
6.3,3.3,6.0,2.5,Iris-virginica
5.8,2.7,5.1,1.9,Iris-virginica
...
模型学习 - 基于PyBrain
数据预处理
这里要采用BP神经网络(多层前馈神经网络)来构建IRIS预测模型(分类器),先对数据进行分析。
- <