所谓注意力就是对新的输入对于原有数据赋予不同的权重。
f ( x ) = ∑ i = 1 n K ( x − x i ) ∑ j = 1 n K ( x − x j ) y i f(x)=\sum \limits_{i=1}^n \frac{K(x-x_i)}{\sum \limits_{j=1}^n K(x-x_j)} y_i f(x)=i=1∑nj=1∑nK(x−xj)K(x−xi)yi
其中K是核函数。衡量x和 x j x_j xj距离之间的函数。每一项就得到了相对的重要性。
其中x是测试集样本的输入, x i x_i xi或者 x j x_j xj、 y i y_i yi是训练集样本。