机器学习
文章平均质量分 82
starry0001
这个作者很懒,什么都没留下…
展开
-
如何采用FM进行召回
FM算法大家应该比较熟悉吧,如果不熟悉的话可以看看张俊林大佬的这篇文章:https://zhuanlan.zhihu.com/p/58160982(不知道为啥,想到FM我就想到微博推荐)。看完了那我们就可以复习一下:FM:y=w0+∑i=1nwixi+∑i=1n∑j=i+1n<vi,vj>xixjFM:y=w_0+\sum_{i=1}^{n}w_ix_i+\sum_{i=1}^{n}\sum_{j=i+1}^{n}<v_i,v_j>x_ix_jFM:y=w0+∑i=1nwix原创 2022-01-13 19:06:47 · 1320 阅读 · 1 评论 -
假设与检验
假设检验 假设检验是统计推断的一种重要形式,其任务是通过样本对未知的总体分布特征作出合理的推断。先对总体分布中的某些参数或者对总体分布类型做某种假设,然后根据样本值做出接受还是拒绝所做假设的结论。相关概念原问题假设问题假设是做假设检验的第一步,一般讲要检验的假设称为原假设,记为: H0H_0H0,则另外一个为备选假设,指拒绝原假设时的假设,记为:H1H_1H1。假设一般分为双边假设和单边假设。双边假设:H0:μ=μ0H_0 : \mu=\mu_0H0:μ=μ0, H1:μ≠μ0H原创 2022-01-13 18:55:07 · 1127 阅读 · 0 评论 -
贝叶斯统计
贝叶斯统计1 概率论和统计学的区别概率论和统计学解决的问题是互逆的。概率论,已经概率模型,模型的不确定性由概率分布来描述,概率论要回答的问题是该过程产生某个结果的可能性有多大这个问题。统计学,概率模型是未知的,但是已经一系列该过程产生的结果的观测值,希望通过这些观测值来推断这个过程中的不确定性是怎么样的?即推断该过程的概率分布。已知概率模型来精确计算各种结果的可能性就是概率论,根据已有的结果来推断模型的不确定性就是统计学概率论有唯一的答案,但是统计学更像是一门艺术。2 古典统计学和贝叶斯统计学原创 2022-01-13 18:54:38 · 1488 阅读 · 0 评论 -
PCA与SVD
PCA与SVDPCA介绍和基本思想 主成分分析(PCA)是一种利用正交变换把由线性相关变量表示的观测数据转化为少数几个由线性无关变量表示的数据。 在主成分分析中,首先对给定的数据进行规范化,使得数据的每一变量的平均值为0,方差为1。之后对数据进行正交变换,原来由线性相关变量表示的数据,通过正交变换变成若干个线性无关的新变量表示的数据,新变量是可能的正交变换中变量的方差最大的,方差表示在新变量上信息的大小,将变量依次成为第一主成分,第二主成分。PCA的相关定义总体主成分分析的定义:1 系数原创 2022-01-13 18:53:56 · 316 阅读 · 0 评论 -
集成树模型系列之一——随机森林
集成树模型系列之一——随机森林随机森林一般会被认为集成树模型的开端,虽然现在工业或者比赛中都很少会被应用,学习集成树模型都绕不过它,它的一些思想被广泛地应用到后面的集成树模型中。随机森林这个取名非常地贴切,涵括了它最重要的2个特征:“随机”,“森林”。森林顾名思义肯定涵盖了很多棵树,随机森林也恰是很多棵决策数组合而成的。那么它是怎么组合而成的呢?我们先引入几个概念:一:bagging和boosting。1:Bagging即套袋法,在多数情况下,bagging 方法提供了一种非常简单的方式来对单一模原创 2021-10-26 23:56:32 · 544 阅读 · 0 评论 -
决策树代码代码——python源代码,看完你就完全懂了
决策树决策树在周志华的西瓜书里面已经介绍的很详细了(西瓜书P73-P79),那也是我看过讲的最清楚的决策树讲解了,我这里就不献丑了,这篇文章主要是分享决策树的代码。在西瓜书中介绍了三种决策树,分别为ID3,C4.5和CART三种决策树,三种树出了分裂的计算方法不一样之外,其余的都一样,大家可以多看看书,如果有什么不清楚的可以看看我的代码,决策树的代码算是很简单的了,我有朋友面试的时候就被要求写决策树代码。话不多说了,下面开始吧。本篇文章的数据来自于西瓜中的西瓜数据,也是我纯手打下来的。下面一起看看代码原创 2021-05-20 23:59:29 · 5422 阅读 · 0 评论