宽带离网用户分析（3）建模框架

最新推荐文章于 2020-07-26 12:47:39 发布

VIP文章 InfSkyline

最新推荐文章于 2020-07-26 12:47:39 发布

阅读量2.8k

点赞数 1

分类专栏：数据挖掘文章标签：离网用户分析建模训练集测试集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/infskyline/article/details/47254089

版权

宽带离网用户分析之建模框架

　　在介绍了任务和数据的预处理方法以后，我们可以从宏观来看看我们的建模过程了。

建模框架

　　首先，我们得明确我们面对的是一个什么问题，稍微有一点数据挖掘知识的应该知道这是一个典型的二分类问题——给你一个用户，和他的数据，问你他会不会离网？
　　当然我们之前说过我们有一年的数据。
　　我们怎样判断该用户是否会离网呢？算命总不行吧，我们有的是之前很多个月的用户数据，这些用户里面就有离网和非离网的用户，我们可以从以往的数据学习到一些经验，然后用这些经验来判断现在的用户是否会离网。
　　这里的“经验”也就是机器学习里面的“分类模型”，而现在让我判断的用户的指标数据就是模型的输入，模型根据这输入得出研判结果，即模型的输出。
　　我们先列出我们的建模框架：
　　
　　这里面特征选择可以先不问，先看其他的部分。要强调的是“训练数据”就是我已经知道他是否离网的历史数据，而测试数据，是我假装我不知道，根据模型进行预测，然后我跟实际结果进行对比，看看我的准确率如何，这个准确率在一定程度上就说明了我的特征和模型的好坏。

训练集和测试集的划分

　　我们再用一张图来解释一下训练集和测试集的划分：
　　训练集测试集的划分
　　我们在去年5-9月份的数据上提取特

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
宽带离网用户分析（3）建模框架

宽带离网用户分析之建模框架　　在介绍了任务和数据的预处理方法以后，我们可以从宏观来看看我们的建模过程了。建模框架　　首先，我们得明确我们面对的是一个什么问题，稍微有一点数据挖掘知识的应该知道这是一个典型的二分类问题——给你一个用户，和他的数据，问你他会不会离网？　　当然我们之前说过我们有一年的数据。　　我们怎样判断该用户是否会离网呢？算命总不行吧，我们有的是之前很多个月的用户数据，这些用户里
复制链接

扫一扫

专栏目录

InfSkyline CSDN认证博客专家 CSDN认证企业博客

码龄9年

36: 原创

105万+: 周排名

157万+: 总排名

7万+: 访问

: 等级

1128: 积分

49: 粉丝

12: 获赞

2: 评论

69: 收藏

私信

关注

热门文章

分类专栏

leetcode 18篇
数据挖掘 18篇

最新评论

产品健康度模型（4）打分I
车车轮轮滚滚滚: 最近也在做类似的工作，看完大佬的文章发现思路惊人的像！不过我没想到用核密度估计，而是直接根据分布映射到对应的分数区间，本质上也是希望利用历史信息，并且使占比多的取值打分区分度尽可能大，也不确定是否严谨，希望和大佬多多交流~
话务预测（5） Ratio
shchsunshine: 您好，可否提供一下话务量预测的数据和源代码，麻烦您了。我的邮箱[email protected]

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。