java机器学习
文章平均质量分 93
用于机器学习算法的学习以及java实现
还在写BUG呢
这个作者很懒,什么都没留下…
展开
-
BP神经网络
在生物神经网络中,最主要的结构便是神经元,如上图所示,便是生物神经元的结构模型,树突感知其他神经元传递的信息,通过轴突向后传播。神经元与神经元之间传播时通过一个突触的结构,通过神经递质改变下一个神经元的电位,当电位超过一定阈值,则信息将通过电位在下一个神经元上进行传递。故我们可将神经元的这种结构特性进行提取,构建神经元模型。M-P神经元模型是1943年由[McCulloch and Pitts,1943]将生物神经元抽象出来的神经元模型,一直沿用至今。在这个模型中,神经元接收n个其他神...原创 2022-08-02 17:58:33 · 320 阅读 · 0 评论 -
矩阵分解(java)
对于任意实矩阵A∈Rm∗nA\in R^{m*n}A∈Rm∗n都可以分解为A=U∑VT(1)A=U\sum V^T\tag{1}A=U∑VT(1)其中,U∈Rm∗mU\in R^{m*m}U∈Rm∗m是满足UTU=IU^TU=IUTU=I的m阶酋矩阵;V∈Rn∗nV\in R^{n*n}V∈Rn∗n是满足VTV=IV^TV=IVTV=I的n阶酋矩阵;∑∈Rm∗n\sum\in R^{m*n}∑∈Rm∗n是mxn的的矩阵,其中(∑)ii=σi(\sum)_{ii}=\sigma_...原创 2022-06-21 19:20:32 · 753 阅读 · 1 评论 -
集成学习之Adaboost
时间:2022/6/13集成学习是一种提升分类器的性能的方法。通过整合多个 基学习器(Base learner来完成学习任务。集成学习被认为是一种 元算法强学习器(Strong learner):相对于弱学习器而言,强学习器指的是可以预测相当精准的学习器。弱学习器(Weak learner):相对于强学习器而言,这类学习器的效果通常只比随机结果要好一点。基学习器(Base learner):是集成学习中,每个单独的学习器即为基学习器。通常采用弱学习器,但不一定必须是弱学习器。基学习算法(Base Lear原创 2022-06-14 18:09:41 · 147 阅读 · 0 评论 -
基于Density Peak的主动学习
时间:2022/6/8关于主动学习,这里有一篇闵老师的文章主动学习: 从三支决策到代价敏感_闵帆的博客-CSDN博客如上图,便是经典的主动学习的流程图。主动学习的主要思想是:通过机器学习,将具有代表性的样本学习出来,再由人工(专家/大师)对这些样本进行标记,再让机器学习模型进行学习。逐步迭代到理想的情况。在闵老师的文章中介绍了,三种主动学习的方式。一是基于密度的主动学习;二是基于代价敏感度的主动学习,三是带标签噪声的主动学习。这里我主要是学习了基于密度的主动学习。关于DP算法,我在另一篇文章中有相关描述,原创 2022-06-08 14:28:27 · 415 阅读 · 0 评论 -
分类器模型评估与选择
分类器模型评估与选择时间:2022/5/25文章目录分类器模型评估与选择1.评估分类器性能的度量1.1.相关知识1.2. 评估度量1.2.1.混淆矩阵(confusion matrix)1.2.2.准确率(Accuracy)1.2.3.灵敏性(Sensitivity)和特效性(Specificity)1.2.4.精度(precision)和召回率(recall)1.2.5.F度量与FβF_{\beta}Fβ度量1.2.6.其他方面度量2.保持方法和随机二次抽样3.交叉检验3.1.k-折交叉验证(k-f原创 2022-05-24 21:32:34 · 494 阅读 · 0 评论 -
决策树(Decision Tree)
决策树(Decision Tree)原创 2022-05-18 16:00:35 · 2499 阅读 · 0 评论 -
基于M-distance的KNN算法
基于M-distance的KNN算法时间:2022/5/4文章目录基于M-distance的KNN算法0.数据集分析1.M-distance2.算法流程3.代码部分4.运行结果学习总结0.数据集分析采用的是电影评分数据集movielens-943u1682m.txt,数据由三部分构成(用户ID、电影ID、评分)。数据采用的是压缩存储的方式。1.M-distance这是闵老师为我们介绍的一个之前的师姐在做推荐系统时发现的距离度量论文地址。结合具体的数据movielens-943u1682m.tx原创 2022-05-11 13:24:23 · 488 阅读 · 0 评论 -
KNN(最邻近算法)
KNN(最邻近算法)时间:2022/5/4目录KNN(最邻近算法)0.数据集分析1.算法思想2.算法流程:3.代码部分4.运行结果5.优化思考5.优化思考0.数据集分析测试使用的数据集为经典的鸢尾花数据集iris.有四个属性,分别为花萼长度(sepallength)、花萼宽度(sepalwidth)、花瓣长度(petallength)、花瓣宽度(petalwidth)。决策属性为种类(setosa、versicolor、virginica)。1.算法思想闵老师在上课时说过,机器学习的本质就是“原创 2022-05-11 13:14:52 · 1144 阅读 · 2 评论