时序数据集---SMAP&MSL

数据集简介

SMAP和MSL是来自NASA的两个公开的真实世界专家标记数据集。每个数据集包含一个训练集和一个测试集,测试集中的异常被标记。它们分别包含27个和55个实体的数据,每个实体分别由55个和25个度量(变量)监视。

数据文件说明

labeled_anomalies:数据处理和两个航天器数据分离依靠此文件。

chan_id: 对应于train和test中对应名字的numpy文件。(对应实体)

spacecraft:chan_id所归属的SMAP或MSL。

anomaly_sequence:对应test中chan_id文件中的index为此范围的为异常序列。

class:有两种异常,point和contextual,前者点异常,后者是整体变化趋势异常。

num_values: 对应chan_id的test文件的时间戳数量。

train:训练集

test:测试集

其中训练集无标签,测试集有标签。

数据集分享

链接:https://pan.baidu.com/s/1g-kT5oHinopEOhK34m1pgQ 

提取码:iotg 

--来自百度网盘超级会员V6的分享

### SMAP 和 MSL 数据集概述 #### SMAP 数据集介绍 SMAP (Soil Moisture Active and Passive) 是由美国宇航局(NASA) 发布的一个用于土壤湿度测量的任务,其数据产品不仅限于土壤湿度还包括其他地球科学参数。该数据集广泛应用于气象学、水文学等领域研究中[^1]。 对于希望获取这些宝贵资源的研究人员来说,可以通过访问NSIDC官方网站并按照指引完成账户创建流程后,在线浏览及下载所需资料[^5]。为了方便科研工作者更高效地利用这些数据,官方还提供了多种工具支持,比如Panoply可视化软件以及一系列Python笔记本实例教程来帮助用户理解和分析数据特性[^3]。 #### MSL 数据集介绍 MSL(Machine Sound Labeling),同样是源自NASA的一项重要成果之一,专注于机器声音识别领域内的异常检测任务。此合内含大量工业设备运行期间产生的声纹记录片段,并附带详尽标注信息以便后续深入探究模式识别算法性能评估等问题[^4]。 值得注意的是,尽管两者名称相似但实际上属于完全不同的应用范畴;前者聚焦自然环境监测而后者则偏向工程维护预警方面的工作需求差异明显。 #### 下载指南 针对上述两类不同性质的数据源,具体的取得方式也有所区别: - **SMAP**: 用户需前往指定链接注册账号并通过身份验证成为合法使用者之后才能获得授权访问权限。接着依照提示操作直至成功提取目标文件夹内容为止。 - **MSL**: 提供了一键式自动化脚本解决方案简化整个过程复杂度——只需执行几条简单的命令行指令就能轻松搞定全部准备工作,极大提高了工作效率的同时降低了人为失误风险[^2]。 ```bash wget https://s3-us-west-2.amazonaws.com/telemanom/data.zip && unzip data.zip && rm data.zip cd data && wget https://raw.githubusercontent.com/khundman/telemanom/master/labeled_anomalies.csv ``` #### 使用方法 无论是哪种类型的时空序列型态,都建议初学者从以下几个角度入手探索: - 利用开源库Pandas加载CSV格式文档入内存作为DataFrame对象便于进一步加工处理; - 借助Matplotlib或Seaborn绘制图表直观展现特征分布规律辅助理解内在联系; - 尝试调用Scikit-Learn内置函数实现基本统计描述计算如均值方差等指标衡量整体水平状况; - 探索更多高级建模技巧例如ARIMA时间预测模型构建长期趋势预估框架等等。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

末世灯光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值