datawhale
文章平均质量分 96
读书不觉已春深!
你所浪费的今天,是昨天死去之人奢望的明天
你所厌恶的现在,是未来的你回不到的曾经。
展开
-
科大讯飞:电信客户流失预测挑战赛baseline
参考:读取数据集: 客户ID 地理区域 是否双频 是否翻新机 当前手机价格 手机网络功能 婚姻状况 家庭成人人数 信息库匹配 预计收入 ... 客户生命周期内平均月费用 客户生命周期内的平均每月使用分钟数 客户整个生命周期内的平均每月通话次数 过去三个月的平均每月使用分钟数 过去三个原创 2022-06-16 23:23:45 · 1611 阅读 · 0 评论 -
学习笔记七:transformer总结(1)
一、attention1.1循环神经网络的不足:长距离衰减问题解码阶段,越靠后的内容,翻译效果越差解码阶段缺乏对编码阶段各个词的直接利用1.2 attention在机器翻译的优点使用全部token信息而非最后时刻的context信息。由此在解码时每时刻可以计算attention权重,让输出对输入进行聚焦的能力,找到此时刻解码时最该注意的词。attention的计算是序列各tokens的v向量和attention权重加权求和,每个词关注到所有词,一步到位,不存在长距离衰减可以关注到不同位原创 2021-12-06 00:03:13 · 1280 阅读 · 0 评论 -
学习笔记七:集成学习1——voting、bagging&stacking
文章目录一、投票法与bagging1.1 投票法的原理分析1.2 Voting案例分析1.3 bagging的原理分析1.4 决策树和随机森林1.5 bagging案例分析二、stacking2.1 Blending算法原理2.2 Blending案例2.3 Stacking算法原理2.4 Stacking算法案例2.4.1 基分类器预测类别为特征2.4.2 基分类器类别概率值为特征2.4.3 基分类器使用部分特征2.4.4 结合网格搜索优化2.4.5 绘制ROC曲线2.4.6 Blending与Sta转载 2021-12-02 00:53:25 · 594 阅读 · 0 评论