机器学习
坚持才有希望
这个作者很懒,什么都没留下…
展开
-
机器学习之线性回归
线性回归方程: f(X)=X’W 这里X是矩阵,每一列代表一个数据,最后一维表示常数1. W是我们要求的参数。 这里x’表示转置线性回归的目标方程: 其中T代表转置 本质:预测结果与实际结果的方差,我们的目标就是要求该误差尽量小。显然这个目标函数是一个凸函数,极小就是最小。 该目标方程的矩阵形式: 对W求偏导数,令偏导数等于0。具体过程 偏导数: 这里的-1表示是矩阵原创 2017-05-19 14:43:07 · 233 阅读 · 0 评论 -
机器学习关联规则(1)apriori
apriori算法基本概念频繁项集出现的频率不低于最小支持度的属性组合,含有K个属性的频繁项集称为频繁K项集支持度属性集与所有记录的百分比,最小支持度是一个阈值,当支持度大于这个阈值就是频繁项集置信度条件概率,置信度(confidence)是D中事物已经包含X的情况下,包含Y的百分比,即条件概率,最小置信度也是一个阈值强关联形如(A,B)这样的组合,P(AB)不小于最小支持度,P(B|A)不小于最小原创 2017-04-24 10:30:56 · 573 阅读 · 0 评论 -
交叉验证
交叉验证通常情况下,大多使用的是简单交叉验证,其主要思想: 1、将全部数据集按一定比例分成训练集和测试集 2、利用训练集进行训练,得到分类模型(假设函数) 3、利用测试集验证第二步得到的训练模型的正确率 4、选择正确率最高的模型 优点:训练集与测试集是分开的,过拟合情况能有效避免。K折交叉验证主要思想(步骤): 1、将全部数据集D分为K个不相交的子集,不妨记为(si,1=留一法本质是K折原创 2017-04-26 23:53:58 · 453 阅读 · 0 评论