第10章 家用电器用户行为分析与事件识别

该案例分析热水器用户行为,通过时间序列数据处理、特征提取来识别用水事件和洗浴事件。数据预处理时发现数据处理部分存在错误,经过修正后,使用Timedelta和diff进行用水事件划分。在模型构建阶段,由于训练样本数量有限,出现训练结果不稳定的状况。尽管模型结果不理想,但时间序列操作的特征工程是关键,值得深入学习。
摘要由CSDN通过智能技术生成

本案例又是一个LM模型的应用。不过比较精彩的部分是时间序列数据的处理操作,进行的数据规约和特征提取部分。书中的代码除了贯序模型中一个错误外,其他并没有发现错误。不过因为本身对于时间序列的操作不是太熟悉,所以基本上就是跟着书中的代码走了一遍。

  1. 挖掘目标
    1.1 根据热水器采集到的数据,划分一次完整的用水事件。
    1.2 在划分好的一次完整的用水事件中,识别出洗浴事件。
  2. 分析方法和过程
    2.1 对热水用户的历史用水数据进行选择性抽取,构建专家样本。
    2.2 对步骤1形成的数据集进行数据探索与预处理。包括探索用水时间时间间隔的分布,规约冗余属性、识别用水数据的缺失值,并对缺失值进行处理,根据建模的需要进行属性构造等。
    2.3 在步骤2的建模样数据基础上,建立洗浴事件识别模型,对洗浴事件识别模型进行分析评价。
    2.4 对步骤3形成的模型结果应用并对洗浴事件划分进行优化。
    2.5 调用洗浴时间识别模型,对实时监控的热水器流水数据进行洗浴时间自动识别。
  3. 数据预处理
    在数据预处理中,我认为书中的提供的数据和描述有所不同。
    在208页中,第3行中:

数据规约:当热水器“开关机状态”为关且水流量为0是,说明热水器不处于工作状态,数据记录可以规约掉。

而在water_heater.xls文件中提供的数据,明显是不满足要求的。如下图所示:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值