论文阅读:Dataset for solarflare prediction using helioseismic and magnetic imager vector magnetic field

在这里插入图片描述

简介

本文提出了一个可用于耀斑事件分析的数据集。该数据集源自磁属性和太阳耀斑数据记录。为了创建这个数据集,作者使用了 SunPy 库,该库提供了访问联合科学运营中心(JSOC)和空间天气预报中心(SWPC)数据的途径。通过整合这两个来源的数据,获得了 8,874 个样本,时间跨度为 2010 年 5 月至 2019 年 12 月。收集到的数据以 CSV 数据集的形式存储。
Repository name: Zenodo
Direct URL to dataset: https://doi.org/10.5281/zenodo.4603412
Direct URL to code: https://doi.org/10.5281/zenodo.4603369
https://github.com/alciomarhollanda/DATA-SET-FOR-SOLAR-FLARE-PREDICTION

数据库描述

提供了 CSV 格式的数据。数据集的每条记录都对应一个太阳耀斑事件,其中包含过去 24 小时的磁场测量值。
包含 8874 条记录: 8,493个非耀斑样本(95.70%)和381个耀斑样本(4.30%)。
为了标定活动区何时发生耀斑事件,采用了NOAA的Events数据。
正例(AR 闪烁 >= M 级耀斑)对应耀斑发生前 24 小时的相应 SHARP 数据。
负例表示每天晚上23:48之前的所有非耀斑 ARs(无事件或 < M 级耀斑)的相应数据。
根据样本的年份提供了以下几组训练/测试集:

  • 2010-2011 for test; 2012-2019 for training.
  • 2012-2013 for test; 2010-2011 and 2014-2019 for training.

最终数据集每条数据记录的特征

属性描述
FLARE_NUMBER耀斑发生与否。标记为1的属性值与M类或X类耀斑事件有关。值等于0时,A -,B -或C -类事件,或者没有事件
T_REC从SHARP获取数据的日期和时间
NOAA_AR事件发生的活动区
QUALITY该属性是指SHARP数据集中显示记录是否为噪声。当高于65536 (或十六进制10 , 000) ,数据处理过程中出现错误。若属性取值在0 ~ 65536之间,则数据质量较好
LONGITUDE在太阳表面的经度
LATITUDE在太阳表面的纬度。
TOTUSJH总无符号流螺旋度
TOTBSQ洛伦兹力总大小
TOTPOT总的光球磁自由能密度
TOTUSJZ总无符号垂向电流
ABSNJZH净流螺旋度的绝对值
SAVNCPP每极性净电流绝对值之和。
USFLUX无符号总通量
AREA_ACR活动区域内的强场像元区域
TOTFZ洛伦兹力Z分量之和
MEANPOT平均光球磁自由能
R_VALUE极性反转线附近的通量之和
EPSZ归一化洛伦兹力z分量之和
SHRGT45剪切力大于 45° 的面积比例
MEANSHR平均剪切角
MEANGAM径向平均视场角
MEANGBT总场的平均梯度
MEANGBZ垂直场平均梯度
MEANGBH水平场平均梯度
MEANJZH平均流螺旋度( Bz)
TOTFY洛伦兹力y分量之和
MEANJZD平均垂向电流密度
MEANALP平均特征扭曲参数,α
TOTFX洛伦兹力x分量之和
EPSY归一化洛伦兹力y分量之和
EPSX归一化洛伦兹力x分量之和

汇集数据并生成最终数据集的方法

  1. 收集数据:该模块使用Python的Sun Py库从SWPC的数据集( GOES Event和SRS数据集)和JSOC的数据集SHARP中收集数据。包括2010年5月至2019年12月期间的数据。
  2. 分配正负事件:GOES Event数据。如果一个活动区在24小时内爆发了一个M -或X -级事件。赋值为属于正类。当分析24小时内的SHARP数据时,GOES Event数据上未报告为M -或X - Class事件的活动区域,模块将活动区域分配为属于负类事件。如果一个活动区域在一天中爆发了不止一个事件,将计数为几个不同的正事件。
  3. 数据集成:
    I.选择事件:在"赋正负事件"模块后,从数据集"正负事件"中选择每个事件,与观测数据( SHARP数据集)进行融合。
    Ⅱ.如果事件为正:
    a .通过"保存的活动区域编号,选定事件开始的日期和时间"。从GOES Event数据集中包含的条目中选取。搜索SHARP数据集,并识别与引起正事件的活动区域相关的属性。
    b .对于GOES Event数据集中的每个正事件( M -类或X -类),记录事件发生之前24小时内的记录。
    Ⅳ.最后,将事件类型与观测数据进行融合。
SWPC
Collect data
JSOC
GOES Event
SHARP
SRS
Assign positive and negtive events
Positive and negtive events
Intergrate positive and negtive events with magnetic measures from the SHARP
Remove events with missing data
Filter of active regions in the SRS dataset
standardize data with z-score
Training and test
Final dataset

整合数据的方法

问题

如果同时有好几个耀斑事件的标签,训练的时候选择哪一个来作为标签?

  • 17
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值