第10章家用电器用户行为分析与事件识别

最新推荐文章于 2024-08-08 08:07:12 发布

望月怀古

最新推荐文章于 2024-08-08 08:07:12 发布

阅读量6.2k

点赞数

分类专栏： python 数据分析文章标签：数据分析 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26978413/article/details/78696817

版权

该案例分析热水器用户行为，通过时间序列数据处理、特征提取来识别用水事件和洗浴事件。数据预处理时发现数据处理部分存在错误，经过修正后，使用Timedelta和diff进行用水事件划分。在模型构建阶段，由于训练样本数量有限，出现训练结果不稳定的状况。尽管模型结果不理想，但时间序列操作的特征工程是关键，值得深入学习。

摘要由CSDN通过智能技术生成

本案例又是一个LM模型的应用。不过比较精彩的部分是时间序列数据的处理操作，进行的数据规约和特征提取部分。书中的代码除了贯序模型中一个错误外，其他并没有发现错误。不过因为本身对于时间序列的操作不是太熟悉，所以基本上就是跟着书中的代码走了一遍。

挖掘目标
1.1 根据热水器采集到的数据，划分一次完整的用水事件。
1.2 在划分好的一次完整的用水事件中，识别出洗浴事件。
分析方法和过程
2.1 对热水用户的历史用水数据进行选择性抽取，构建专家样本。
2.2 对步骤1形成的数据集进行数据探索与预处理。包括探索用水时间时间间隔的分布，规约冗余属性、识别用水数据的缺失值，并对缺失值进行处理，根据建模的需要进行属性构造等。
2.3 在步骤2的建模样数据基础上，建立洗浴事件识别模型，对洗浴事件识别模型进行分析评价。
2.4 对步骤3形成的模型结果应用并对洗浴事件划分进行优化。
2.5 调用洗浴时间识别模型，对实时监控的热水器流水数据进行洗浴时间自动识别。
数据预处理
在数据预处理中，我认为书中的提供的数据和描述有所不同。
在208页中，第3行中：

数据规约：当热水器“开关机状态”为关且水流量为0是，说明热水器不处于工作状态，数据记录可以规约掉。

而在water_heater.xls文件中提供的数据，明显是不满足要求的。如下图所示：

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。