惯例,首先对源代码致以崇高的感谢和敬意:https://blog.csdn.net/Snoopy_Yuan/article/details/70230862
学习神经网络,pybrain是个好东东,上链接http://pybrain.org/docs/index.html#installation
mac系统安装python比较神奇的是,不用管环境变量,终端窗口里一顿pip3 install就能搞定很多包,例如装pybrain的前置条件:numpy scipy nose等等。
pybrain稍微麻烦一点,需要先装git,百度git官网就有mac安装包和教程,很贴心的有中文,一路next即可。
具体到代码,pybrain的api写的很简略,源代码的处理流程是比较通用的,但具体每一步为什么这么用,只能对着api连蒙带猜了。
最近翅膀有点硬,对于源代码的疑问是,为什么标准BP只训练一次,而累积BP要训练50次,然后对比错误率。本着站在同一起跑线的原则,都调整成一样的训练次数,不过结论没啥变化。
import pandas as pd
with open("/Users/huatong/PycharmProjects/Data/watermelon_33.csv",mode="r") as data_file:
df=pd.read_csv(data_file)
#独热编码即 One-Hot 编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码
#使用pandas中的get_dummies方法来创建哑特征,get_dummies默认会对D