- 博客(8)
- 资源 (13)
- 收藏
- 关注
原创 svm简单例子
一刀两段,就是这样。一维点分割,二维线切割,三维面间隔。反正分开两者的总是低一维的平面。数据 和前面一样,多角度组合成一个结合体 ,用来描述综合特征。数据还是经过数字化处理。分割 数据分两类,svm本身也只支持二分类问题,想要进行多分类,也只能层级二分类了。 当然了,为了层级的划分数据类型,用决策树来进行引导也是不错的选择。毕竟它描述了影响的大小。 有优先级的划分总能够朝着...
2018-04-30 18:19:16 6343
原创 管中窥豹
把图线都归类为0的规则,尽然是没有错误的。 只不过把f(x)说成愚者的做法,显然是不够正确的。追踪 重复f(x)的做法,把 y - x^2 = 0转化成f(x) = x^2。 这个二人游戏,变成了一个人的自娱自乐。 因为0的规则束缚着他们,让他们可以互相探知,知一而见二。 我们看见的图像,并不是真正的是在。实际上,x和y从未碰面。 我们规定的点,是两个单...
2018-04-25 22:03:58 398
原创 函数的轨迹
因果 小学的时候就接触过方程了,一元方程 y = kx + b 让我发现了新世界。从此觉得事物都可以衡量。 一个起因x,经过逻辑的转换,终于造就了一个结果y。 接下来是方程组,看到因果的交集。 然后,初中了解了一元二次,好像参悟大道,飞升在即。 直到后来的多元,多次。最终放弃了。 然后抛弃自己愚蠢的想法----这东西是永无止尽的,而且用途已经偏离生活。 不...
2018-04-23 23:33:42 983 1
原创 sklearn-KNN
判断 物以类聚,人以群分。 1. 创建坐标系衡量 2. 计算距离来表现相似度,大致判断出主体类型 就是这样了。 不过加入一个条件,选取周边的范围。因为范围太大的话,实际上就取决于样本中数据的比例了。 汉奸接触的太君不多,良民很少,不过他还是汉奸啊。样式 总体流程就是这样,封装了之后就只剩下逻辑拼装了,细节全屏蔽。from sklearn import ne...
2018-04-22 18:57:19 365
原创 距离的度量
长度 长度时什么东西,仔细想起来我也不清楚了。百科说的是:一维空间中点到点的距离。 不过距离又是什么?又得依靠长度来进行表示,然后就是死循环了。 所以,长度就是描述一维空间中两个点远近的量,这样比较容易理解。 正如信息量一样,评判信息含量的问题。长度也只是一个基本的平台。 重要的永远不是平台,而是运用这个平台能够完成我们想要的度量和比较。 继续梳理一下长度。很多...
2018-04-22 14:07:58 441
原创 sklearn决策树
对信息做了度量,但是追根究底,度量却不是目的。手段不是目的,这是缺月梧桐中的名句。有多少迷失在路上的人,应该时刻的回想起自己的初衷。对信息有了评判标准以后,关键的才开始。以这个为依据,我们能做些什么,怎么去做?对信息做了度量之后,就可以有对比,对比的结果指引了方向,损失函数什么的也有了度量。根据方向,不断前行,这是我们的价值所在。和机器不同在于1. 人的精神粮食指引方向,方向不明确;朝方向前进,前...
2018-04-22 03:00:53 3733
原创 信息的影响
单体的比较 两个单纯信息之间,哪个信息的信息量更大呢? 先说说这种信息的特性:信息中只包含一种影响因素 形象一点,就是说拔河队伍之中,只有同一种人;不再是接力赛,而是个人田径,只有一个人。 所以考虑的就只是步长和步数,或者是速度和时间。没有更多的因素。 简而言之,就是单个类型的群体的信息贡献量,明确点,就是包含的单一类型信息的信息量对比。 就好比两个人的财富对比...
2018-04-21 21:07:12 573
原创 信息的度量
香农公式个人理解基本信息就是消息,只要表达了某种状态,都可以称作是信息。生活中一直有无数消息在传播,但是重要性不一致,大多的消息甚至谈不上信息,因此经常被忽略。消息作为信息被进行衡量的标准,依赖于两个方面: 1. 影响 如果和自身不相关,甚至从来不想去探究。对某则消息完全不想关心,这东西就对你可有可无,可能根本不想有,因为有了也不理会,只是徒增烦恼。至于它会有什么样的作用,影响.....
2018-04-21 18:48:31 6520 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人