简介
xLearn 是一款高性能的,易用的,并且可扩展的机器学习算法库,你可以用它来解决大规模机器学习问题,尤其是大规模稀疏数据机器学习问题。在近年来,大规模稀疏数据机器学习算法被广泛应用在各种领域,例如广告点击率预测、推荐系统等。如果你是 liblinear、libfm、libffm 的用户,那么现在 xLearn 将会是你更好的选择,因为 xLearn 几乎囊括了这些系统的全部功能,并且具有更好的性能,易用性,以及可扩展性。
安装
安装指南 https://xlearn-doc-cn.readthedocs.io/en/latest/install/index.html
可以通过源码安装
一键脚本
或者pip安装(pip安装容易遇到问题)
demo
import xlearn as xl
ffm_model = xl.create_fm()
# 训练集
ffm_model.setTrain("./small_train.txt")
# 设置验证集
ffm_model.setValidate("./small_test.txt")
# 设置参数
param = {'task':'binary','lr':0.2,'lambda':0.002}
# 模型保存为model.txt
ffm_model.setTXTModel("./model.txt")
# 训练模型
ffm_model.fit(param, "model.out")
# 测试集
ffm_model.setTest("small_test.txt")
# 输出样本预测概率,范围(-1,1)
ffm_model.predict("model.out","output.txt")
# 设置预测概率范围为(0,1)
ffm_model.setSigmoid()
ffm_model.predict("model.out","output2.txt")
#
ffm_model.setSign()
ffm_model.predict("model.out","output3.txt")
FM 简介
预测:
训练
损失函数 1-二分类问题:
损失函数2-连续值的预测:
代码实现:
todo