machine learning
文章平均质量分 74
luiyezheng
这个作者很懒,什么都没留下…
展开
-
线性回归中的数学原理
线性回归优点:结果易于理解,计算上不复杂缺点:对非线性的数据拟合不好适用数据类型:数值型和标称型 基本步骤: 收集数据 准备数据 分析数据 训练算法 测试算法 使用算法 平方误差的计算公式:sum[1,m]=(yi−xiT×W)2sum[1,m]=(yi-xi^T\times W)^2 ( .T在这里代表矩阵的转置,是python中常用的语法)W最优解公式:w最优=(XT×X)−1×XT×yw原创 2015-10-07 21:18:54 · 1438 阅读 · 0 评论 -
python K-近邻分类器
用python构建一个K近邻分类器,包括分类器的构建,导入数据,数据分析,数据归一化,并在最后对K取值进行分析原创 2015-09-17 14:51:37 · 1256 阅读 · 0 评论 -
信息熵与信息增益
信息熵与信息增益 信息熵 信息熵的出现解决了信息的量化度量问题,由克劳德香农提出,用来描述信息源的不确定程度。信息论之父克劳德香农第一次用数学语言阐明了概率与信息冗余度的关系。 我们可以根据一件事情出现的概率来衡量其确定性。假设: 1.设不确定性函数为f,则f是概率p的单调递减函数。 2.两个独立事件所产生的不确定性等于各自不确定性之和,称为可加性。 同时满足以上两个条件的函数原创 2015-09-19 23:45:40 · 1118 阅读 · 0 评论