感知机:
感知机接收多个输入信号,输出一个信号。这里所说的“信号”可以想象成电流或河流那样具备“流动性”的东西。像电流流过导线,向前方输送电子一样,感知机的信号也会形成流,向前方输送信息。但是,和实际的电流不同的是,感知机的信号只有“流/不流”(1/0)两种取值。
其中x1、x2是输入信号,y是输出信号,w1、w2是权重(w是weight的首字母)。图中的○称为“神经元”或者“节点”。输入信号被送往神经元时,会被分别乘以固定的权重(w1x1、w2x2)。神经元会计算传送过来的信号的总和,只有当这个总和超过了某个界限值时,才会输出1。这也称为“神经元被激活”。这里将这个界限值称为阈值,用符号θ表示。用数学表达式表达如下:
感知机的多个输入信号都有各自固有的权重,这些权重发挥着控制各个信号的重要性的作用。也就是说,权重越大,对应该权重的信号的重要性就越高。
导入权重和偏置:
我们用感知机实现与门,实际就是确定w1,w2,θ的值。满足与门上述数学表达式的w1,w2,θ有很多种。这里我们取(w1, w2, θ) = (0.5, 0.5, 0.7)用python简单实现一下与门。
def AND(x1, x2):
w1, w2, theta = 0.5, 0.5, 0.7
tmp = x1 * w1 + x2 * w2
if tmp <= theta:
return 0
elif tmp > theta:
return 1
print('AND(0,0)=%d' % (AND(0, 0)))
print('AND(1,0)=%d' % (AND(1, 0)))
print('AND(0,1)=%d' % (AND(0, 1)))
print('AND(1,1)=%d' % (AND(1, 1)))
运行结果如下:
刚才的与门的实现比较直接、容易理解,但是考虑到以后的事情,我们将其修改为另外一种实现形式。首先把数学表达式的θ换成−b。
此处,b称为偏置,w1和w2称为权重。感知机会计算输入信号和权重的乘积,然后加上偏置,如果这个值大于0则输出1,否则输出0。与之前数学表达式表达的内容完全相同。下面我们就用使用权重和偏置实现与门,与非门,或门,异或门。
与门:
import numpy as np
def AND(x1, x2):
x = np.array([x1, x2])
w = np.array([0.5, 0.5])
b = -0.7
tmp = np.sum(w * x) + b
if tmp <= 0:
return 0
else:
return 1
print('AND(0,0)=%d' % (AND(0, 0)))
print('AND(1,0)=%d' % (AND(1, 0)))
print('AND(0,1)=%d' % (AND(0, 1)))
print('AND(1,1)=%d' % (AND(1, 1)))
与非门:
import numpy as np
def NAND(x1, x2):
x = np.array([x1, x2])
w = np.array([-0.5, -0.5]) # 仅权重和偏置与AND不同!
b = 0.7
tmp = np.sum(w*x) + b
if tmp <= 0:
return 0
else:
return 1
print('NAND(0,0)=%d' % (NAND(0, 0)))
print('NAND(1,0)=%d' % (NAND(1, 0)))
print('NAND(0,1)=%d' % (NAND(0, 1)))
print('NAND(1,1)=%d' % (NAND(1, 1)))
或门:
import numpy as np
def OR(x1, x2):
x = np.array([x1, x2])
w = np.array([0.5, 0.5]) # 仅权重和偏置与AND不同!
b = -0.2
tmp = np.sum(w*x) + b
if tmp <= 0:
return 0
else:
return 1
print('OR(0,0)=%d' % (OR(0, 0)))
print('OR(1,0)=%d' % (OR(1, 0)))
print('OR(0,1)=%d' % (OR(0, 1)))
print('OR(1,1)=%d' % (OR(1, 1)))
异或门:
异或门无法用单层感知机实现,我们可以使用前面实现的与门,与非门,或门构建多层感知机实现。
import numpy as np
def AND(x1, x2):
x = np.array([x1, x2])
w = np.array([0.5, 0.5])
b = -0.7
tmp = np.sum(w * x) + b
if tmp <= 0:
return 0
else:
return 1
def NAND(x1, x2):
x = np.array([x1, x2])
w = np.array([-0.5, -0.5]) # 仅权重和偏置与AND不同!
b = 0.7
tmp = np.sum(w*x) + b
if tmp <= 0:
return 0
else:
return 1
def OR(x1, x2):
x = np.array([x1, x2])
w = np.array([0.5, 0.5]) # 仅权重和偏置与AND不同!
b = -0.2
tmp = np.sum(w*x) + b
if tmp <= 0:
return 0
else:
return 1
def XOR(x1, x2):
s1 = NAND(x1, x2)
s2 = OR(x1, x2)
y = AND(s1, s2)
return y
print('XOR(0,0)=%d' % (XOR(0, 0)))
print('XOR(1,0)=%d' % (XOR(1, 0)))
print('XOR(0,1)=%d' % (XOR(0, 1)))
print('XOR(1,1)=%d' % (XOR(1, 1)))
多层感知机(在理论上)可以表示计算机。