![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
springtostring
这个作者很懒,什么都没留下…
展开
-
DeepFM Pytorch实现(Criteo数据集验证)
本文主要任务是利用Pytorch实现DeeoFM模型,并在将模型运行在Criteo数据集上进行验证测试。DeepFM模型简述 FM模型善于挖掘二阶特征交叉关系,而神经网络DNN的优点是能够挖掘高阶的特征交叉关系,于是DeepFM将两者组合到一起,实验证明DeepFM比单模型FM、DNN效果好。DeepFM相当于同时组合了原Wide部分+二阶特征交叉部分+Deep部分三种结构,无疑进一步增强了模型的表达能力。数据集介绍和运行环境运行环境:python 3.6、...原创 2020-08-24 20:20:37 · 7709 阅读 · 19 评论 -
Mean Percentage Ranking (MPR) 实现
Mean Percentage Ranking (MPR) 是推荐系统的一个常用的评估函数,在IMF和LMF论文中都使用这一评价指标。 mpr实现:import numpy as npdef MPR(R_hat,R): ''' :param R_hat: user dot item :param R: ratting ...原创 2020-06-20 21:00:24 · 719 阅读 · 0 评论 -
朴素贝叶斯法理论学习和拼写检查器实战
贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。简单表达式为: P(A|B)=P(A)P(B|A)/P(B) 在机器学习中,我们将P(A|B)称为后验概率,P(A)称为先验概率肯定会有人疑惑:为什么要把一个表达式拆为两个式子相乘,增加计算的难度?这必然是有原因,在实际问题中一些问题的...原创 2018-04-06 16:41:03 · 590 阅读 · 0 评论 -
SKlearn实现鸢尾花分类
1.鸢尾花数据集介绍:Iris数据集是常用的分类实验数据集,由Fisher在1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。基于Fisher的线性判别模...原创 2018-04-29 17:06:12 · 10899 阅读 · 0 评论 -
手写--logistic回归
我们想要的函数应该是,能接受所有的输入然后预测出类别。例如,在两个类的情况下,上 述函数输出0或1。或许之前接触过具有这种性质的函数,该函数称为海维塞德阶跃函数 (Heaviside step function),或者直接称为单位阶跃函数。然而,海维塞德阶跃函数的问题在于: 该函数在跳跃点上从0瞬间跳跃到1,这个瞬间跳跃过程有时很难处理。幸好,另一个函数也有类 似的性质,且数学上更易处理,这就是S...原创 2018-06-06 21:35:18 · 1883 阅读 · 0 评论 -
评价分类器性能指标AUC、ROC
原文地址:https://www.zybuluo.com/frank-shaw/note/152851引子假设有下面两个分类器,哪个好?(样本中有A类样本90个,B 类样本10个。)、 A类样本 B类样本 分类精度 分类器C1 A*90(100%) A*10(0%) 90% 分类器C2 A*70 + B*20 (78%) A*5 ...转载 2018-08-09 10:55:04 · 591 阅读 · 0 评论