learn
文章平均质量分 85
wait_for_eva
longer
展开
-
sklearn决策树
对信息做了度量,但是追根究底,度量却不是目的。手段不是目的,这是缺月梧桐中的名句。有多少迷失在路上的人,应该时刻的回想起自己的初衷。对信息有了评判标准以后,关键的才开始。以这个为依据,我们能做些什么,怎么去做?对信息做了度量之后,就可以有对比,对比的结果指引了方向,损失函数什么的也有了度量。根据方向,不断前行,这是我们的价值所在。和机器不同在于1. 人的精神粮食指引方向,方向不明确;朝方向前进,前...原创 2018-04-22 03:00:53 · 3734 阅读 · 0 评论 -
seaborn
影响seaborn与matlotlib同出一源,只是把matplotlib进行了封装,让许多方法调用时变得更加简便。简单的操作就能够画出更加复杂的图像。由于seaborn是调用的matplotlib,在使用时,两个库可以进行互操作。最通俗的样子就是import seaborn as snsimport matplotlib.pyplot as plt# 数据集iris = sns.load...原创 2018-05-24 22:58:32 · 4540 阅读 · 0 评论 -
梯度下降
背景就目前的淡薄知识,总结一般的学习步骤和约束关系假设概率变换极大似然反向求解其中概率可以是直接计算,也可以是通过误差的高斯分布进行替换。概率上的推导,依赖于相关数学知识。最后的关键,最后变成了对极大似然函数的极值求解。必要诚然,线性回归中,通过直接的推导,我们把结果给直接推导了出来。但是,基础的线性回归作为求解中的最大巧合,在其他方面却出处受限。对于不收敛,或者不平滑,完全不存在导数为0的点时,...原创 2018-05-26 19:01:01 · 340 阅读 · 0 评论 -
线性回归
一般方程转换为矩阵引入误差一般的方程暂时这样理解就够了。高斯分布反正不定出现的,高斯都会露下脸基本假设误差也是随机的,这就是一切推理的交织点了。我们假设:误差服从高斯分布。可能觉得扯远了,不过实际上,对于x,y我们都已经知道了,想寻找他们之间的关系。如果假定关系,那就无从求解,唯一可行的,就是从这个不起眼的误差下手。联系误差关系带入,变为极大似然前面逐渐的深入了,不过最终导向何方,好像更迷茫了。极...原创 2018-05-25 22:40:58 · 167 阅读 · 0 评论 -
简单Git
结构说明Git会对每一步的文件修改进行记录,不论是从简单的修改到最终的确定,以前的基础到继续的开发,都会进行对应的记录。对于基础的二次开发,必要条件是基于某次的定稿,就是最终的版本,后面的版本切换和分支会进行讲述。而对于一次问题的修改、完善到定稿过程,分别对应进行修改记录。分作工作区,缓存区和版本区,对应为草稿、副本、定稿。初稿可能不止修改一次,定稿也可能有多个版本。对于每份定稿,git都会进行存...原创 2018-05-07 21:55:08 · 151 阅读 · 0 评论 -
简单matplotlib
子图位置data = pd.read_csv('data.csv')# @ax :画布# @2 :子图行数# @3 :子图列数# @4 :子图序号,按照从左到右,从上到下顺序编号ax = plt.subplot(2, 3, 4)plt.show()设置data = pd.read_csv('data.csv')# figure设置画图宽高# @6 :宽度...原创 2018-05-21 00:54:14 · 200 阅读 · 0 评论 -
简单pandas
封装numpypandas是基于numpy进行整合的,通过层级的剥离,可以追溯到numpy中的ndarray的结构和操作。Series在numpy的基础之上,封装为了Series,可以理解为一个字典,带上了名称,值就是ndarraySeries.index就是名称Series.values就是ndarray类型的数据集了DataFrame进一步对Series进行封装,最上层就是pandas中最长使...原创 2018-05-20 20:36:19 · 232 阅读 · 0 评论 -
简单conda
环境管理查看环境conda info -e:列出已安装环境,anaconda自带为root安装环境conda create -n env_name python=version:-n指定名称,version指定版本conda create -n env_name python=version package ...:后面跟上包名可以在安装时自动安装指定包进入环境activate env_name:...原创 2018-05-07 16:58:23 · 293 阅读 · 0 评论 -
简单numpy
矩阵 当做多维列表,层级嵌套,便于理解。 也可以当做:属性+样本。二维的容易理解,更高维度的属性当做多维属性即可。 向量理解:各组向量合成统一值。低维度向量合成高维度向量,然后组合。 矩阵理解:抽取简单逻辑,复杂数据由矩阵代替,关心关系而非细节计算。创建 指定data = numpy.array([[1,2,3],[4,5,6],[7,8,9]]) 随机data...原创 2018-05-19 22:21:22 · 178 阅读 · 0 评论 -
管中窥豹
把图线都归类为0的规则,尽然是没有错误的。 只不过把f(x)说成愚者的做法,显然是不够正确的。追踪 重复f(x)的做法,把 y - x^2 = 0转化成f(x) = x^2。 这个二人游戏,变成了一个人的自娱自乐。 因为0的规则束缚着他们,让他们可以互相探知,知一而见二。 我们看见的图像,并不是真正的是在。实际上,x和y从未碰面。 我们规定的点,是两个单...原创 2018-04-25 22:03:58 · 400 阅读 · 0 评论 -
信息的影响
单体的比较 两个单纯信息之间,哪个信息的信息量更大呢? 先说说这种信息的特性:信息中只包含一种影响因素 形象一点,就是说拔河队伍之中,只有同一种人;不再是接力赛,而是个人田径,只有一个人。 所以考虑的就只是步长和步数,或者是速度和时间。没有更多的因素。 简而言之,就是单个类型的群体的信息贡献量,明确点,就是包含的单一类型信息的信息量对比。 就好比两个人的财富对比...原创 2018-04-21 21:07:12 · 575 阅读 · 0 评论 -
信息的度量
香农公式个人理解基本信息就是消息,只要表达了某种状态,都可以称作是信息。生活中一直有无数消息在传播,但是重要性不一致,大多的消息甚至谈不上信息,因此经常被忽略。消息作为信息被进行衡量的标准,依赖于两个方面: 1. 影响 如果和自身不相关,甚至从来不想去探究。对某则消息完全不想关心,这东西就对你可有可无,可能根本不想有,因为有了也不理会,只是徒增烦恼。至于它会有什么样的作用,影响.....原创 2018-04-21 18:48:31 · 6531 阅读 · 1 评论 -
函数的轨迹
因果 小学的时候就接触过方程了,一元方程 y = kx + b 让我发现了新世界。从此觉得事物都可以衡量。 一个起因x,经过逻辑的转换,终于造就了一个结果y。 接下来是方程组,看到因果的交集。 然后,初中了解了一元二次,好像参悟大道,飞升在即。 直到后来的多元,多次。最终放弃了。 然后抛弃自己愚蠢的想法----这东西是永无止尽的,而且用途已经偏离生活。 不...原创 2018-04-23 23:33:42 · 988 阅读 · 1 评论 -
svm简单例子
一刀两段,就是这样。一维点分割,二维线切割,三维面间隔。反正分开两者的总是低一维的平面。数据 和前面一样,多角度组合成一个结合体 ,用来描述综合特征。数据还是经过数字化处理。分割 数据分两类,svm本身也只支持二分类问题,想要进行多分类,也只能层级二分类了。 当然了,为了层级的划分数据类型,用决策树来进行引导也是不错的选择。毕竟它描述了影响的大小。 有优先级的划分总能够朝着...原创 2018-04-30 18:19:16 · 6345 阅读 · 0 评论 -
sklearn-KNN
判断 物以类聚,人以群分。 1. 创建坐标系衡量 2. 计算距离来表现相似度,大致判断出主体类型 就是这样了。 不过加入一个条件,选取周边的范围。因为范围太大的话,实际上就取决于样本中数据的比例了。 汉奸接触的太君不多,良民很少,不过他还是汉奸啊。样式 总体流程就是这样,封装了之后就只剩下逻辑拼装了,细节全屏蔽。from sklearn import ne...原创 2018-04-22 18:57:19 · 366 阅读 · 0 评论 -
距离的度量
长度 长度时什么东西,仔细想起来我也不清楚了。百科说的是:一维空间中点到点的距离。 不过距离又是什么?又得依靠长度来进行表示,然后就是死循环了。 所以,长度就是描述一维空间中两个点远近的量,这样比较容易理解。 正如信息量一样,评判信息含量的问题。长度也只是一个基本的平台。 重要的永远不是平台,而是运用这个平台能够完成我们想要的度量和比较。 继续梳理一下长度。很多...原创 2018-04-22 14:07:58 · 442 阅读 · 0 评论 -
逻辑回归
概率转换函数图像意义对连续值进行离散分类,通过线性计算解决分类问题。逻辑(后向)分类->概率->种子->关系->线性式->关系组合我们总是可以找到一个模棱两可的线性关系,但是对于分类问题是一个范围性的边界。一般情况下,我们需要得出一个最直白的条件,然后根据明确的边界进行类型的划分。但是反推一下,如果能够大致的进行划分,为了符合划分的条件,中间的量又有什么关系。一个是从...原创 2018-05-30 00:01:31 · 186 阅读 · 0 评论