机器学习
璀璨下的一点星辰
这个作者很懒,什么都没留下…
展开
-
推荐系统常用数据集
转载自:https://www.cnblogs.com/shenxiaolin/p/8337913.html 首先需要说明一下推荐系统数据中的几个类别:Item: 即我们要推荐的东西,如产品、电影、网页或者一条信息片段User:对item进行评分以及接受推荐系统推荐的项目的人Rating:用户对item的偏好的表达。评分可以是二分类的(如喜欢和不喜欢),也可以是整数(如1到5星...转载 2018-08-22 09:17:24 · 15871 阅读 · 0 评论 -
ARIMA时间序列算法
1.检验序列的平稳性(原始序列时序图、原始序列自相关图)判断是平稳序列还是非平稳序列 参考: https://www.cnblogs.com/bradleon/p/6832867.html2.平稳序列可以用ARMA模型,非平稳性序列需要进行差分运算,经过差分运算(经过一次是一阶段、经过两次是两阶、、)后将非平稳序列转化成平稳序列 并进行白噪声检验,对一阶差分之后的序列再进行平...原创 2018-08-22 15:47:31 · 4775 阅读 · 0 评论 -
数据挖掘十大算法之Apriori详解
在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献【1】。本博客已经介绍过的位列十大算法之中的算法包括:[1] k-means算法(http://blog.csdn.net/...转载 2018-08-20 15:00:53 · 3167 阅读 · 0 评论 -
机器学习第三章----线性模型
终于要开始写自己的机器学习笔记了,对于要从第三章开始写也是因为自己之前比较懒把笔记都记在了一个个小纸片上,由于图片大小大于2M,之前拍成照片的笔记传不上来所以我也没办法了,以后要开始正式的记录这个过程了,希望自己可以坚持下来。 3.1基本形式 利用数据得出一个线性公式,f(x)=w*x+b...原创 2018-08-20 15:32:40 · 2489 阅读 · 0 评论 -
Apriori关联规则算法整个思路
1.设定最小支持度和置信度,支持度确定规则可以用于给定数据集的频繁程度,置信度确定YY在包含XX的交易中出现的频繁程度。support是支持度,confidence是置信度。2.通过读取获取的数据:去除重复元素,得到所有的基本元素如(A、B、C、D、E)称为1项候选集C1,并且算出来每个项的支持度。3.在C1候选集中通过设定的最小支持度去除非频繁项(非频繁项与其他项组合也是非频繁项...原创 2018-08-21 14:18:44 · 2874 阅读 · 0 评论 -
机器学习博客搜集
机器学习系列:https://blog.csdn.net/han_xiaoyang?t=1转载 2018-09-26 13:54:51 · 163 阅读 · 0 评论