机器学习
文章平均质量分 68
xiao韩
一只大猪猪
展开
-
推荐系统-矩阵分解
推荐系统-矩阵分解为什么要矩阵分解先说几点邻近模型的问题:1.物品之间存在相关性,信息量并不随着向量维度增加而线性增加;2.矩阵元素稀疏,计算结果不稳定,增减一个向量维度,导致邻近结果差异很大的情况存在。上述两个问题,在矩阵分解中可以得到解决。矩阵分解,直观上说来就是把原来的大矩阵,近似分解成两个小矩阵的乘积,在实际推荐计算时不再使用大矩阵,而是使用分解得到的两个小矩阵。具体说来就是,假设用户物品的评分矩阵 A 是 m 乘以 n 维,即一共有 m 个用户,n 个物品。我们选一个很小的数 k,这个原创 2021-01-31 11:10:17 · 382 阅读 · 0 评论 -
推荐系统-近邻推荐
推荐系统-近邻推荐说到推荐系统,最先想到肯定是协同过滤。协同过滤的重点在于协同”,所谓协同,也就是群体互帮互助,互相支持是集体智慧的体现,协同过滤也是这般简单直接,历久弥新。协同过滤当推荐系统先使用基于内容推荐的推荐系统之后,就有了可观的用户行为了,这些用户行为通常是正向的,也就是用户或名或暗的表达出自己喜欢的行为。这些行为可以表达成一个用户和物品的关系矩阵,或者说网络,或者是说图,其实都是一个东西。上述的用户物品的关系矩阵是协同过滤算法中最为重要的。协同过滤通常划分为两类:基于记忆的协同过滤;基于模原创 2021-01-26 11:35:48 · 245 阅读 · 0 评论 -
推荐系统-内容推荐
推荐系统-内容推荐用户画像一个推荐系统大概有三步:认识每一个用户->给他推荐他感兴趣的东西->各种指标上升。用户画像(User Profile)大体分为给机器看的和给人看的,其中给人看的一般是运营,产品等用的。我们这里只关注给机器看的。我们知道要对用户和物品进行计算,是需要对数据进行计算的,因此我们首先就要将用户和物品都向量化,用户向量化后的结果,就是User Profile,俗称“用户画像”,所以,用户画像不是推荐系统的目的,而是在构建推荐系统过程中产生的一个关键环节的副产品。用户画像原创 2021-01-20 11:14:57 · 937 阅读 · 0 评论 -
推荐系统-基础概念
推荐系统-基础概念推荐系统是什么 推荐系统是一种信息过滤系统,手段是预测用户(User)对物品(Item)的评分和偏好。 推荐系统做什么?它可以把用户和物品之间能产生的联系提前找出来。推荐系统需要做什么?从已有的连接去预测未来的连接。推荐系统怎么做?机器推荐和人工推荐,相对应就是个性化推荐以及编辑推荐。推荐系统的问题模式 推荐系统的使命是为用户和物品建立连接,方式是提前找出那些隐藏的连接呈现给用户,这属于一个预测问题,又可以细分为评分预测和行为预测。评分预测 比如:用户消费完一个物品之原创 2021-01-18 14:37:20 · 247 阅读 · 0 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(七)--支持向量机SVM(Support vector machines)
一、支持向量机的概述给定训练样本集,分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同样本分开,支持向量机就是讨论并解决怎么找到这样的超平面。在样本空间中,划分超平面可通过如下线性方程来描述: 其中为法向量,决定了超平面的...原创 2019-10-29 16:56:47 · 911 阅读 · 1 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(六)--集成学习_FM/GBDT/Xgboost
一、随机森林/FM(Random Forst)随机森林是集成学习Bagging流派中一个变体,RF在以决策树为基学习构建Bagging集成的基础上,进一步在决策树的训练过程中引入随机属性选择。传统的决策树在选择划分属性时是在当前节点的属性集合中选择最优的一个;而在RF中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分。...原创 2019-10-03 16:32:59 · 1351 阅读 · 0 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(五)--集成学习_提升方法
一、集成学习概论集成学习(Ensemble learning)通过构建并结合多个学习器来完成学习任务,实际上,就是“三个臭皮匠顶个诸葛亮”的道理。集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化能力。这对“弱学习器(weak learner)”尤为明显,因此集成学习的很多理论研究都是针对弱学习器进行的,而基学习器有时也被称为弱学习器。一般根据弱学习器有无依赖关系,大...原创 2019-09-19 09:39:56 · 394 阅读 · 0 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(四)--决策树(Decison-Tree)
一、决策树的概论决策树是一种基本的分类与回归方法,是表示基于特征对示例进行分类与回归的树形结构。决策树可以转换成一个if-then规则的集合,也可以看作是定义在特征空间划分上的类的条件概率分布。一般的,一颗决策树包含一个根结点,若干个内部节点和若干个叶结点,每个叶结点对应于决策结果,其他的每个结点则对应于一个属性测试,生成决策树的基本流程遵循‘分而治之’策略。具体算法如下:输入:训练集...原创 2019-08-31 13:55:45 · 946 阅读 · 0 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(三)--贝叶斯分类器(Bayes)
一、贝叶斯概论假设有N种可能的类别标记,即,是将一个真实的的样本误分类成所产生的损失。在后验概率的基础上可得到将样本x分类成的期望损失(条件风险):需要寻找到一个准则,使得所有样本对每个分类产生的条件风险最小,显然,对每个样本x能最小化条件风险即可,因此就有贝叶斯判定准则(Bayes decision rule):为最小化总体条件风险,只需要在每个样本上选择能使条件风险最小,即,此时则...原创 2019-07-22 11:09:29 · 536 阅读 · 0 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(二)--线性模型(Linear model)
一、线性回归(Linear regression)线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记,用公式表达为:,使得。那么怎么求得w,b呢?基本使用最小二乘法和梯度下降。最小二乘法:最小化均方差函数(本连载一中有相关解释)。 梯度下降:是一种迭代算法。选取适当的初值,不断迭代,更新参数值,进行目标函数的极小化,直到收敛。由于负梯度方向是使函数值下降最快的方向,在迭代的每一步...原创 2019-07-16 15:56:16 · 825 阅读 · 0 评论 -
《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(一)--模型选择+误差评估
一、模型选择1.1 模型模型就是学习的条件概率分布或者决策函数(这里只指监督学习)。条件概率的集合:,决策函数的集合:。条件概率表示的模型为概率模型,决策函数表示的模型为非概率模型。1.2 模型选择模型选择基本是选择一个模型评估指标(均方差、准确率、F1等)同时考虑欠拟合(在训练集上表现不好-为将训练样本的一般性质学好)和过拟合(在训练集和测试集上表现有很大差异-将训练集上的性质学...原创 2019-07-11 11:01:01 · 1469 阅读 · 0 评论