- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 信息的混杂度——香农熵
熵被定义为信息的期望值。一个人的性别——男、女——可以看成是一个信息;一件衣服的颜色——很多颜色——也是信息。但是这两种信息一个非常简单,只有两个可能的值,而颜色是非常多的。也可以说颜色的信息量要比性别的信息量要大、要更加混杂。而熵就是衡量这种混杂度的数学指标。 那么具体一点,一个符号A的信息被表示为: >>> from math import log >>> probabilityA
2013-06-21 11:47:33 3060
原创 监督学习之k Nearest Neighbors算法
首先说kNN算法是一种有监督学习的分类算法。所谓有监督学习,就是在应用算法之前我们必须准备一组训练集,训练集中的每个实例都是由一些特征和一个分类标签组成;通常还会存在一个测试集,用来测试训练出来的分类模型的准确性。其实kNN算法并没有体现出有监督学习的所有特点,没有模型,只有算法。甚至可以说这就是一种暴力扫描法,运行效率上比较低效。 在理解算法之前,先要了解多维空间中两个点之间的距离的概
2013-06-20 12:00:29 1604
ASGI 3.0规范中文版.pdf
2019-12-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人