算法原理-笔记
专门记录个人在学习工作中有关数据挖掘算法的学习笔记。
落花生@u
梧桐沧海孤狼,拱星映月不回头,一路向前。
展开
-
【算法8】BP神经网络
为 单层感知机——> 多重感知机 ——> BP神经网络 推导的手稿记录。原创 2019-10-16 12:59:55 · 462 阅读 · 0 评论 -
【算法1】多元线性回归
多元线性回归模型的可解释性强,模型泛化能力比较好。使得它在实际商业环境中使用广泛。这里推出多元回归模型的个人见解,其中若有纰漏之处,恳请各位看官“怒怼”,小落必然“痛改前非,再接再厉”。大家一起学习,共同进步,加油~~~原创 2019-09-30 14:02:15 · 2741 阅读 · 1 评论 -
【算法2】Logistic回归
多元线性回归的优点是可解释性强,计算速度快,模型稳定,主要解决因变量为连续型的业务问题。Logistic回归是由线性回归“演化”而来,自然具备线性回归的优点,主要解决因变量是二(多)分类的业务问题。前面的文章 《【R】基于Logistic回归的初始信用评级》对Logistic回归做过一些介绍,这里再进行一些补充。原创 2019-10-01 10:41:42 · 285 阅读 · 1 评论 -
【算法3】 KNN
最简单的机器学习算法——K-近邻算法(K-Nearest Neighbor),缩写KNN,通过计算距离来判定样本是否所属同一类。原创 2019-10-01 13:48:17 · 156 阅读 · 1 评论 -
【算法4】决策树
决策树是一种树结构,属于有监督无参数学习方法。基于信息学理论中熵的概念,决策树的经典算法有ID3、C4.5、Cart(基尼准则)算法。原创 2019-10-01 18:34:29 · 143 阅读 · 1 评论 -
【算法5】朴素贝叶斯
朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据 集,首先基于特征条件独立假设学习输入/ 输出的联合概率分布;然后基于此模型,对给定的输入 x利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法。原创 2019-10-03 14:58:42 · 171 阅读 · 2 评论 -
【算法6】K-Means聚类
聚类属于无监督分类算法。用得较多的有基于距离的聚类——K-Means,基于密度的聚类——DBSCAN。可以用作数据降维、数据离散压缩、客户分群等用途。原创 2019-10-05 22:50:43 · 288 阅读 · 0 评论 -
【算法7】集成算法
集成学习(Ensemble learning)就是将若干个弱分类器通过一定的策略组合之后产生一个强分类器,是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果,使模型表现更稳定可靠。原创 2019-10-06 10:39:35 · 256 阅读 · 0 评论