智源 - 看山杯专家发现算法大赛 2019 baseline

最新推荐文章于 2024-06-27 12:00:00 发布

追梦程序员

最新推荐文章于 2024-06-27 12:00:00 发布

阅读量1.2k

点赞数

分类专栏：机器学习文章标签：看书杯 baseline

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30374549/article/details/102584894

版权

机器学习专栏收录该内容

18 篇文章 4 订阅

订阅专栏

github: https://github.com/liuchenailq/zhihu-baseline

智源 - 看山杯专家发现算法大赛 2019

文件说明

features.py : 从原始数据集中生成特征
deepfm.py: 运行deepfm模型并取得预测结果
textdeepfm.py: 运行textdeepfm模型并取得预测结果
utils.py: deepctr运行环境

模型说明

模型一：DeepFM

运行环境： DeepCTR-Torch (https://github.com/shenweichen/DeepCTR-Torch)

分数（AUC）：线下0.6903 线上0.691804111317667 （没有采用五折交叉验证，可能还没收敛，设置epoch大些）

特征说明

1.用户特征
用户原始特征：gender、frequency、A1、…
用户关注和感兴趣的topics数目

**2.问题特征 **
问题标题的字、词计数
问题描述的字、词计数
问题绑定的topic数目

3.用户问题交叉特征
用户关注、感兴趣的话题和问题绑定的话题交集计数
邀请距离问题创建的天数

模型二：TextDeepFM

模型说明：在DeepFM基础上增加文本特征，将用户感兴趣的话题作为用户的embedding，将问题绑定的话题作为问题的embedding。
文本特征利用TextCNN作为特征提取器，提取的特征和原始特征向量拼接一起传给DNN训练。

分数（AUC）：线下0.7251481779973195 线上0.701741036192302 （没有采用五折交叉验证）

最后，有意向共同参赛、共同学习的伙伴请添加个人微信号

追梦程序员

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

追梦程序员 CSDN认证博客专家 CSDN认证企业博客

码龄9年

73: 原创

4万+: 周排名

37万+: 总排名

25万+: 访问

: 等级

3033: 积分

199: 粉丝

172: 获赞

75: 评论

853: 收藏

私信

关注

分类专栏

最新评论

利用K-means进行图像压缩
MRYYY___: 吴恩达的机器学习课程和这个例子是一样的
基于机器学习中KNN算法的车牌字符识别
2401_85379367: 您好，我也想要一份您的训练的数据集，可以发邮箱吗，地址2789152648@qq.com 感谢
如何寻找想要的数据集
m0_62196601: https://computenest.console.aliyun.com/user/dataset/cn-hangzhou 🌟 阿里云的「计算巢」产品现已更新，增添了多个热门中文数据集，以便大家能够更便捷地进行数据分析和机器学习项目。 🔗 数据集支持交流：若您在使用过程中遇到困难，或对GitHub和Huggingface平台的访问存在障碍，我们诚邀您加入专属的钉钉群——数据集支持群。在这里，您可以畅所欲言，寻求技术支持，与行业同仁交流心得 https://qr.dingtalk.com/action/joingroup?code=v1,k1,Eznu/6X1Kmkdu39nhzBGOcJtpkh36bSVNId88jd4T+E=&_dt_no_comment=1&origin=11
机器学习之预测PM2.5项目报告
专注编程: 想问问开头都需要导入那些包和库
机器学习之预测PM2.5项目报告
专注编程: 求完整代码

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。