numpy 常用工具函数 —— np.bincount/np.average

<a href=“http://blog.csdn.net/lanchunhui/article/details/50072453”, target="_blank">numpy 常用api(一)
<a href=“http://blog.csdn.net/lanchunhui/article/details/50429205”, target="_blank">numpy 常用api(二)

一个函数提供 random_state 的关键字参数(keyword parameter):是为了结果的可再现性(reoccurrence)或叫可重复性。

1. np.bincount():统计次数

接口为:

numpy.bincount(x, weights=None, minlength=None)

尤其适用于计算数据集的标签列(y_train)的分布(distribution),也即获得 class distribution

>>> np.bincount(y_train.astype(np.int32))
>>> np.bincount(np.array([0, 1, 1, 3, 2, 1, 7]))
array([1, 3, 1, 1, 0, 0, 0, 1], dtype=int32)
			# 分别统计0-7分别出现的次数

If weights is specified the input array is weighted by it, i.e. if a value n is found at position i, out[n] += weight[i] instead of out[n] += 1.

>>> w = np.array([0.3, 0.5, 0.2, 0.7, 1., -0.6]) # weights
>>> x = np.array([0, 1, 1, 3, 2, 2])
>>> np.bincount(x, w)
array([ 0.3,  0.7,  0.4,  0.7])
			# 0: 0.3
			# 1:0.5+0.2
			# 2: 1+(-0.6)
			# 3: 0.7

np.bincount() 从零开始计数(不允许序列中出现负数);

>>> np.bincount([3, 4, 4, 3, 3, 5])
array([0, 0, 0, 3, 2, 1], dtype=int32)
							# 分别表示0出现的次数,
							# 1出现的次数,
							# 2出现的次数,
							# 。。。

2. np.average()

np.average(X, axis=0, weights=w) == w.dot(X)

等式左部表示加权平均,sum(w)==1时才有意义,也即等式的左部比等式的右部多了一层加权平均的意义,内积代表着实现该意义的动作。

X = np.array([[.9, .1],
              [.8, .2],
              [.4, .6]])
w = np.array([.2, .2, .6])
print(w.dot(X))
print(np.average(X, axis=0, weights=w))

在一些情况下**只能使用np.average()**而无法使用简单的矩阵乘法操作:
比如:

P = np.asarray([c.predict_proba(X) for c in clfs])
							# 此时P是一个三维矩阵
							# (# of clfs) * (# of samples) * (# of classes)
np.average(P, axis=0, weights=w)
							# 此时的shape为 ((# of samples) * (# of classes))
							# 仍然维持行和为1
							

也有一些情况下只能使用 np.average 而无法使用dot(矩阵乘法,matrix multiplication)运算:

def predict_proba(self, X):
	probas = np.asarray([clf.predict_proba(X) for clf in self.classifiers_])
	# return self.weights.dot(probas)
				# 此时self.weights有未赋值的风险
				# None类型肯定是不支持dot函数的
	return np.average(probas, axis=0, weights=self.weights)
				# np.average的功能便是,如果weights参数为None
				# 就执行正常的求平均操作
  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值