机器学习
冰凌其
这个作者很懒,什么都没留下…
展开
-
机器学习——分类算法3:朴素贝叶斯(Bayes) 思想 和 代码解释
思想:1、朴素贝叶斯方法,是指:朴素:特征为条件独立假设----各个事件条件独立贝叶斯:基于贝叶斯定理:P(A|B) = P(AB) / P(B) ---变形---> P(AB) = P(A|B) * P(B) = P(B|A) * P(A)根据贝叶斯定理,对一个分类问题,给定样本特征 X ,样本属于类别 Y 的概率是P(Y|X)是后验概率,是事件X发生...原创 2018-01-30 18:23:31 · 2333 阅读 · 0 评论 -
机器学习——分类算法4:Logistic回归 梯度上升 思想 和 代码解释
思想(这个只有输出层的神经网络也有用到):在Logistic回归中,1、首先介绍Sigmoid函数: 可以看到它的值域(0,1),通过sigma函数计算出最终结果,以0.5为分界线,最终结果大于0.5则属于正类(类别值为1),反之属于负类(类别值为0)。2、将Sigmoid函数g(z)作为阀门,令Z=WT X,此时这里的大写符号都是向量,然后将Z代入到g(Z)里面。原创 2018-01-31 21:50:32 · 1130 阅读 · 0 评论 -
机器学习——分类算法2:决策树 思想和代码解释
思想:将原始数据集根据决定性特征划分为几个数据子集,这些数据子集会分布在第一个决策点的所有分支上,如果某个分支下的数据属于同一类型,则表示到达终止模块,可以得到结论,无需进一步对数据集进行分割;如果子集内的数据不属于同一类型,则需重复划分数据子集,直到所有具有相同类型的数据均在一个数据子集内。但是应该怎样划分数据呢,显然是根据决定性特征,这里引进一个度量标准--信息增益(划分数据集之前之后...原创 2018-01-28 21:52:11 · 398 阅读 · 0 评论 -
机器学习——分类算法1:k-近邻 (KNN) 思想和代码
k-近邻 (KNN)思想:一个样本数据集合(亦称训练样本集),并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数,最后,选择k个最...原创 2018-01-27 18:36:48 · 425 阅读 · 0 评论 -
机器学习——分类算法5:支持向量机 (SVM) 思想和代码
这个比较难懂,所以花费的时间比较长,我用了一个星期,希望看的人时间短一点。先看https://blog.csdn.net/zouxy09/article/details/17291543,将他的思想结合下面的代码,看明白还有这篇都结合着看 https://www.cnblogs.com/bentuwuying/p/6444249.html对于H和L的理解那个我搞了半天,原理是这样另外标签分类相等的...原创 2018-04-03 20:30:04 · 534 阅读 · 0 评论 -
机器学习算法:18大数据挖掘的经典算法以及代码Java实现
https://python.ctolib.com/article/wiki/95851数据挖掘十大类经典算法基于Java8实现。算法目录常用的标准数据挖掘算法包名 目录名 算法名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法 AssociationAnalysis Da...转载 2019-03-01 16:33:16 · 4038 阅读 · 0 评论