机器学习与推荐算法
文章平均质量分 74
好好学习,天天向上
nuist__NJUPT
本硕计算机专业,硕士研究生在读,目前快手集团预入职员工,曾于阿里子公司哈啰出行等实习,已发SCI论文,拥有多项发明和实用新型专利,华为杯等多项国家级和省级竞赛获奖,喜欢编程,leetcode刷题狂,擅长Java、Python、JS、Matlab、C等编程语言,前端、后端、移动端都能写,算法也会一些,热爱运动,热爱生活!
展开
-
推荐算法之隐语义模型(LFM)矩阵分解梯度下降算法实现
推荐算法之隐语义模型(LFM)矩阵分解梯度下降算法实现基于协同过滤的推荐一般分为基于近邻的推荐和基于模型的推荐,其中,基于近邻是指预测时直接使用用户已有的偏好数据,通过近邻数据来预测新物品的偏好。而基于模型的方法,是使用已知偏好数据来训练模型,找到内在规律,再用模型来做预测,类似于回归。基于模型的方法,在训练时,可以基于标签内容来提取物品特征,可以让模型去发掘物品的潜在特征,这样的模型被称为隐语义模型(LFM)。用隐语义模型进行协同过滤的目标:揭示隐藏的特征,这些特征解释为什么能给出预测的评分,这类特原创 2021-12-10 20:25:55 · 1270 阅读 · 1 评论 -
推荐系统之TF-IDF算法实现
推荐系统之TF-IDF算法实现词频-逆文档频率(TF-IDF)是一种用于资讯检索与文本挖掘的常加权技术。该技术是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中一个文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。如下公式:TF是字词在文件中出现的频率,即词频;DF是字词在语料库中出现的频率,即逆文档频率。下面我们看一下词频TF的计算公式,分子表示i在j中出现的次数,分母表示文档j的总词数。我们再看一下逆向文件频率的公式,其中原创 2021-12-06 11:46:18 · 1596 阅读 · 0 评论 -
机器学习之无监督学习-K均值聚类算法
机器学习之无监督学习-K均值聚类算法对于无监督学习,有两类重要的应用,一个是聚类,一个是降维。我们今天主要学习聚类中的K均值聚类。我们先看看下图,图a为原始的数据点,我们想要对图a的数据点进行分类,在图b中我们先随机的指定两个质心点(×)作为初始点。如图c所示,距离红色点(×)近的我们分到红色类中,距离蓝色点(×)近的我们分类到蓝色类中。接下来我们更新质心点,如图d所示,根据已有红色的点,求均值,得到它们中间的质心点,更新为当前红色质心点,根据已有蓝色的点,求均值,得到它们中间的质心点,更新为当前蓝色的原创 2021-12-05 14:41:58 · 1864 阅读 · 0 评论 -
机器学习之监督学习-分类模型决策树的基本概念
机器学习之监督学习-分类模型决策树决策树是一种简单高效且具有强解释性的模型,广泛应用于数据分析领域,其本质是一棵自上而下的由多个判断节点组成的树。我们看看如下图的两棵决策树,第一棵是相亲的决策树,叶子节点是决策结果,结果分为两类,即“见”或者“不见”。第二个决策树是动物分类的决策树,第二个决策树不是二分,而是多分,但是仍是多个离散值,属于分类问题。下面我们看一张统计表,从表中我们可以看到对应日期时候小明是否去打球了,但是我们能总结预测出什么情况下小明会去打球吗,从表中我们好像并不太能看出。下面我原创 2021-12-05 08:54:47 · 473 阅读 · 0 评论 -
机器学习之监督学习-分类模型逻辑斯蒂回归
机器学习之监督学习-分类模型逻辑斯蒂回归逻辑斯蒂回归就是用回归的方式找到分类曲线,进行分类,通过一条曲线,拟合分类边界。我们先了解一下sigmod函数,也叫做压缩函数。我们看一下a^x的函数图像,如果x小于0,则函数单调递减,如果x大于0,则函数单调递增,且函数过点(0,1)。我们再看一下压缩函数的图像,该函数明显在负无穷到正无穷单调递增,在负无穷时候趋近于0,在正无穷的时候趋近于1,其实可以用大于0.5和小于0.5实现两类划分。如下图所示,模型h(x),系数取值得到分类函数,令分类函数等于原创 2021-12-04 20:21:07 · 610 阅读 · 0 评论 -
机器学习之监督学习-分类模型K近邻(KNN)算法实现
机器学习之监督学习-分类模型K近邻(KNN)算法实现监督学习中常用的分类分类模型有k近邻,逻辑斯谛回归,决策树。今天我们主要学习,K近邻模型。最简单,最初级的分类器就是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以进行分类。K近邻(KNN)K近邻是一种基本分类方法,通过测量不同特征值之间的距离进行分类,它的思路是:如果一个样本在特征有k个最相似的大多数属于某一类别,则该样本也属于某一类别,其中K通常是不大于20的整数,KNN算法中所选择的邻居都是已经正原创 2021-12-04 17:24:02 · 2454 阅读 · 0 评论 -
机器学习之回归模型-调用sklearn库求解线性回归
机器学习之回归模型-调用sklearn库求解线性回归在使用sklearn库之前,我们先看一下这个库的结构,该库经常用于监督学习和无监督学习,sklearn共分为6大部分,分别用于完成分类任务,回归任务,聚类任务,降维任务,模型选择以及数据的预处理。由图中,可以看到库的算法主要有四类:分类,回归,聚类,降维。其中:常用的回归:线性、决策树、SVM、KNN ;集成回归:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees常用的分类:线性、决策树、SVM、KNN原创 2021-12-04 11:16:39 · 2025 阅读 · 0 评论 -
机器学习之回归模型-梯度下降法求解线性回归
机器学习之回归模型-梯度下降法求解线性回归线性回归是一种线性模型,它假设输入变量x与单个输出变量y之间存在线性关系。具体的说,就是利用线性回归模型,从一组输入变量的线性组合中,计算出输出变量y。如果有两个或者两个以上的自变量,这样的线性回归分析,就是多元线性回归。其实,在实际生活中,一个现象往往受多个因素的影响,所以多元线性回归比一元线性回归的应用更广。假如说:我想买西瓜,此时,我应该挑选自己满意的西瓜,那么怎么挑选呢,我们应该从从色泽,根蒂,敲打的声音等多个维度考察西瓜的质量,假如每个影响西瓜的因素原创 2021-12-03 17:37:06 · 5560 阅读 · 0 评论 -
机器学习之回归模型-一元线性回归理论与最小二乘法实现
机器学习之回归模型-线性回归理论与最小二乘法实现线性回归是一种线性模型,它假设输入变量x与单个输出变量y之间存在线性关系。具体的说,就是利用线性回归模型,从一组输入变量的线性组合中,计算出输出变量y。如下图所示,只有一次项,我们称之为线性。正常我们求解线性方程的方式如下所示:当我们有两组数据,我们就可以带入求解出系数,若再有一组值,则可以带入验证。正常两个点确定一条直线,但是实际情况往往是海量数据,而不是2组数据,即大量的点,而不是两个点,我们要的是一条尽量可能拟合这些点分布状态的一条直线,即原创 2021-12-03 15:05:49 · 1485 阅读 · 0 评论 -
1天学完python语法知识
三天学完python语法知识python是个解释性的脚本语言,不需要编译,直接解释。python是按照缩进格式划分代码段的,c,Java之类的都是通过括号划分代码段。一、注释注释的作用增加程序的可读性,方便程序员之间协作工作。单行注释是 #多行注释是6个单引号#这是python的一个单行注释、'''你好,一起学习python吧这是一个多行注释'''print("python")二、变量x=1y=2a=b=c=1d,e, f,g = 1, True, 5.5, 5+4j原创 2021-12-02 10:03:28 · 1688 阅读 · 0 评论 -
机器学习基础-监督学习与无监督学习
机器学习基础-监督学习与无监督学习以及强化学习机器学习(Machine Learning)主要研究计算机系统对特定任务的性能,逐步进行改善的算法和统计模型。通过输入海量数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类和预测。机器学习主要包括:有监督学习,无监督学习及强化学习,神经网络与深度学习,集成学习。无监督学习算法采用一组仅包含输入的数据,通过寻找数据内在结构进行样本点的分组或聚类。该算法从没有被分类和测试的数据中去学习,无监督学习不是响应反馈,而是识别数据原创 2021-11-30 11:32:34 · 3060 阅读 · 0 评论 -
推荐系统与推荐算法概念与简介
推荐系统与推荐算法简介一、推荐系统的目的针对海量数据和信息过载的情况。面对海量的数据信息,从中快速提取符合用户特点的物品,解决一些人的选择恐惧症,主要面向一些没有明确需求的人。一个好的推荐系统应实现三方面1-让用户更好的获取自己需要的内容2-让内容更好更快的推送到喜欢的人手中3-让网站(平台)更有效的保留用户资源二、推荐系统的应用推荐系统的应用范围很广,现在比较主流的如抖音,淘宝,微博等等都应用了推荐系统,如下图所示的领域都涉及到推荐系统。不同的业务场景推荐系统是有很大不同的。三、推荐系原创 2021-11-27 11:03:08 · 2453 阅读 · 0 评论