数据挖掘项目:基于热水器的洗浴事件识别

前言

1. 项目描述

本项目基于热水器采集的时间序列数据,将顺序排列的离散的用水时间节点根据水流量和停顿时间间隔划分为不同大小的时间区间,每个区间是一个可理解的一次完整用水事件,并以热水器一次完整用水事件为一个基本事件,将时间序列数据划分为独立的用水事件并识别出其中属于洗浴的时间。(理论上单片机记录数据的频率是2秒一次)

2.处理流程

数据预处理->用水事件划分->特征工程->标签重做

该博文仅以截图形式展现,具体代码详见个人GitHub:https://github.com/None950823/Recognition-of-bathing-behavior-based-on-water-heater

数据探索性分析EDA

在这里插入图片描述在这里插入图片描述
可见该数据集是来自一个热水器,也可以说是一个用户的用水记录。

查看缺失值等基本数据集信息:
在这里插入图片描述在这里插入图片描述

在这里插入图片描述
可见有水和没水基本是一半的比例
在这里插入图片描述在这里插入图片描述上图说明用水时间间隔基本在2附近。
在这里插入图片描述在这里插入图片描述在这里插入图片描述

数据预处理

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

特征重做

在这里插入图片描述主要围绕三个方向做特征:
在这里插入图片描述在这里插入图片描述在这里插入图片描述上面的这种处理方式只是我个人的处理方式,这块可发挥性太大,完全可以使用其他处理。
在这里插入图片描述在这里插入图片描述至此,所有用水事件(洗菜、洗手、洗衣、洗浴等)划分完毕,下面开始做特征:
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

制作标签

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

构建模型

在这里插入图片描述在这里插入图片描述XGB
在这里插入图片描述在这里插入图片描述BP
在这里插入图片描述分析总结:很诧异,准确率达到了100%,可能原因有两种:一数据量太少;二是因为数据标签是自己做的,存在不正确的划分方式,而正种方式被模型学习到了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值