用python实现感知机
输入参数:
1)学习率 eta : float
2)遍历训练集次数:n_iter : int
3)随机权重初始化种子:random_state : int
import numpy as np
class Perceptron(object):
def __init__(self, eta=0.01, n_iter=50, random_state=1):
self.eta = eta
self.n_iter = n_iter
self.random_state = random_state
def fit(self, X, y):
rgen = np.random.RandomState(self.random_state)
self.w_ = rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])
self.errors_ = []
for _ in range(self.n_iter):
errors = 0
for xi, target in zip(X, y):
update = self.eta * (target - self.predict(xi))
self.w_[1:] += update * xi
self.w_[0] += update
errors += int(update != 0.0)
self.errors_.append(errors)
return self
def net_input(self, X):
"""Calculate net input"""
return np.dot(X, self.w_[1:]) + self.w_[0]
def predict(self, X):
"""Return class label after unit step"""
return np.where(self.net_input(X) >= 0.0, 1, -1)
主要函数 fit
1)rgen
为 numpy 的随机数生成器
2)self.w_
初始化权重
rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])
产生标准差为0.01的正态分布
3)self.errors_ = []
会把每次迭代中收集的分类错误记入 self.errors_ 列表
函数 net_input
np.dot 用于计算 向量点积 wT x
不把权重初始化为零的原因:
权重为非零值,学习率才会影响分类结果
如果所有的权重都初始化为零,那么学习率只会影响权重向量的大小,而不会影响其方向