算法
just-do-it-zzj
有人经常说:选择比努力更重要,可是如果你不努力,哪里有选择的机会。
展开
-
[机器学习]推荐系统介绍
目录1 前言2 个性化推荐系统概述3 个性化推荐系统的常用算法3.1协同过滤推荐3.1基于关联规则的推荐4 个性化推荐系统的技术改进1 前言互联网的高速发展,促进了各行各业的发展,也为电子商务的发展提供了条件。电子商务让企业的销售和获客线下搬到了线上。人们不出门就可以很便捷地在网上购买他们喜欢的东西,提供了购物的效率。但是随着信息的增加,物品品牌和种类爆炸式增长,使消费者面对选择时难以抉择。因为这样的原因推荐系统横空出世,它一方面解决消费者面对选择时不知所措的尴尬,另一方面解原创 2020-12-30 16:53:07 · 347 阅读 · 0 评论 -
[机器学习]关联挖掘算法Apriori和FP-Growth以及基于Spark 实例
目录Apriori 算法FP-Growth算法算法原理步骤1 统计各个商品被购买的频次步骤2 构建FP树步骤3 频繁项的挖掘阅读本文需要了解关联挖掘的基本知识,了解关联挖掘的基本原理,参考《[机器学习]关联挖掘介绍》。Apriori 算法Apriori算法就是根据有关频繁项集特性的先验知识而命名的。它使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。首先,找出频繁1-项集的集合.记做L1,L1用于找出频繁2-项集的集合L2,再用于找出L3,...原创 2020-12-24 10:04:27 · 714 阅读 · 0 评论 -
[机器学习]关联挖掘介绍
关联挖掘又称关联分析,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。如下是一个超市的几笔交易记录:中:TID代表交易流水号,Items代表一次交易的商品。相关概念:1、事务:每一条交易称为一个事务,例如示例1中的数据集就包含四个事务。2、项:交易的每一个物品称为一个项,例如Cola、Egg等。3、项集:包含零个或多个项的集合叫做项集,例如{Cola, Egg, Ham}。4、k−项集:包含k个项的项集叫做k...原创 2020-12-07 14:16:37 · 2340 阅读 · 0 评论 -
[机器学习]朴素贝叶斯原理和基于Spark 实例
朴素贝叶斯分类贝叶斯原理的由来:贝叶斯为了解决一个叫“逆向概率”问题写了一篇文章,尝试解答在缺乏太多可靠证据的情况下,怎样做出更符合数学逻辑的推测。逆向概率:逆向概率是相对正向概率而言。正向概率的问题很容易理解,比如我们已经知道袋子里面有 N 个球,不是黑球就是白球,其中 M 个是黑球,那么把手伸进去摸一个球,就能知道摸出黑球的概率是多少。这是在了解了事情的全貌再做判断。在现实生活中,我们很难知道事情的全貌。贝叶斯则从实际场景出发,提了一个问题:如果我们事先不知道袋子里面黑球和白球的比例,而是通过我原创 2020-11-30 09:56:10 · 488 阅读 · 0 评论 -
[机器学习]机器学习常用的模型评估方法
目录混淆矩阵正确率精确率召回率灵敏度伪阳性率特异度P-R曲线:F1-值ROC曲线AUC面积均方误差均方根误差平均绝对误差混淆矩阵 实际值\预测值 预测值 Positive Negative 实际值 Positive TP FN Negative FP原创 2020-11-27 16:19:53 · 1117 阅读 · 0 评论 -
sklearn knn 算法
最近邻分类算法优点:简单,易理解,易实现;适合对稀有事件进行分类。适合多分类问题(multi-modal,对象有多个类别标签),k-nn比svm更合适缺点:1、当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数2、计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它...原创 2018-08-02 08:16:23 · 257 阅读 · 0 评论