![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
狗花
这个作者很懒,什么都没留下…
展开
-
用GBDT、XGboost、神经网络生成新的特征
‘’'pythonimport numpy as npimport pandas as pdimport xgboost as xgbfrom sklearn.datasets import make_classificationfrom sklearn.linear_model import LogisticRegressionfrom sklearn.ensemble import...原创 2018-09-19 10:31:32 · 2647 阅读 · 0 评论 -
FM-FFM-DEEPFM
FM的一些理解传统多项式模型FM算法传统多项式模型一般的线性模型没有考虑特征间的关联(组合)。为了表述特征间的相关性,我们采用多项式模型。在多项式模型中,特征xi与xj的组合用xixj表示。在数据稀疏性普遍存在的实际应用场景中,二次项参数的训练是很困难的。其原因是,每个参数 wij 的训练需要大量 xi 和xj都非零的样本;由于样本数据本来就比较稀疏,满足“xi 和 xj 都非零”的样本将会...原创 2019-01-07 21:53:08 · 256 阅读 · 0 评论 -
梯度下降
梯度下降参考https://www.2cto.com/net/201610/557111.html如此看来梯度下降的时间复杂度为o(nCI),n代表样本数量(n = 1为随机梯度下降,n = mini-batchsize为mini-batch梯度下降),C代表单个样本计算量(取决于梯度计算公式),I为迭代次数,取决于收敛速度。...翻译 2019-05-29 12:46:07 · 386 阅读 · 0 评论 -
不同模型预测分数之间如何可比
从N个二分类模型出来的分数是不可比的,因为模型分数并不能完全刻画实际概率(以逻辑回归算法为例,只有当y服从伯努利分布,逻辑回归的得分值才有可能为实际的概率值,但现实中,很难如此,具体可以参考https://www.jianshu.com/p/a8d6b40da0cf?utm_campaign=haruki&utm_content=note&utm_medium=reader_sha...原创 2019-09-29 16:54:29 · 1200 阅读 · 0 评论