简介
本文提出了一个可用于耀斑事件分析的数据集。该数据集源自磁属性和太阳耀斑数据记录。为了创建这个数据集,作者使用了 SunPy 库,该库提供了访问联合科学运营中心(JSOC)和空间天气预报中心(SWPC)数据的途径。通过整合这两个来源的数据,获得了 8,874 个样本,时间跨度为 2010 年 5 月至 2019 年 12 月。收集到的数据以 CSV 数据集的形式存储。
Repository name: Zenodo
Direct URL to dataset: https://doi.org/10.5281/zenodo.4603412
Direct URL to code: https://doi.org/10.5281/zenodo.4603369
https://github.com/alciomarhollanda/DATA-SET-FOR-SOLAR-FLARE-PREDICTION
数据库描述
提供了 CSV 格式的数据。数据集的每条记录都对应一个太阳耀斑事件,其中包含过去 24 小时的磁场测量值。
包含 8874 条记录: 8,493个非耀斑样本(95.70%)和381个耀斑样本(4.30%)。
为了标定活动区何时发生耀斑事件,采用了NOAA的Events数据。
正例(AR 闪烁 >= M 级耀斑)对应耀斑发生前 24 小时的相应 SHARP 数据。
负例表示每天晚上23:48之前的所有非耀斑 ARs(无事件或 < M 级耀斑)的相应数据。
根据样本的年份提供了以下几组训练/测试集:
- 2010-2011 for test; 2012-2019 for training.
- 2012-2013 for test; 2010-2011 and 2014-2019 for training.
最终数据集每条数据记录的特征
属性 | 描述 |
---|---|
FLARE_NUMBER | 耀斑发生与否。标记为1的属性值与M类或X类耀斑事件有关。值等于0时,A -,B -或C -类事件,或者没有事件 |
T_REC | 从SHARP获取数据的日期和时间 |
NOAA_AR | 事件发生的活动区 |
QUALITY | 该属性是指SHARP数据集中显示记录是否为噪声。当高于65536 (或十六进制10 , 000) ,数据处理过程中出现错误。若属性取值在0 ~ 65536之间,则数据质量较好 |
LONGITUDE | 在太阳表面的经度 |
LATITUDE | 在太阳表面的纬度。 |
TOTUSJH | 总无符号流螺旋度 |
TOTBSQ | 洛伦兹力总大小 |
TOTPOT | 总的光球磁自由能密度 |
TOTUSJZ | 总无符号垂向电流 |
ABSNJZH | 净流螺旋度的绝对值 |
SAVNCPP | 每极性净电流绝对值之和。 |
USFLUX | 无符号总通量 |
AREA_ACR | 活动区域内的强场像元区域 |
TOTFZ | 洛伦兹力Z分量之和 |
MEANPOT | 平均光球磁自由能 |
R_VALUE | 极性反转线附近的通量之和 |
EPSZ | 归一化洛伦兹力z分量之和 |
SHRGT45 | 剪切力大于 45° 的面积比例 |
MEANSHR | 平均剪切角 |
MEANGAM | 径向平均视场角 |
MEANGBT | 总场的平均梯度 |
MEANGBZ | 垂直场平均梯度 |
MEANGBH | 水平场平均梯度 |
MEANJZH | 平均流螺旋度( Bz) |
TOTFY | 洛伦兹力y分量之和 |
MEANJZD | 平均垂向电流密度 |
MEANALP | 平均特征扭曲参数,α |
TOTFX | 洛伦兹力x分量之和 |
EPSY | 归一化洛伦兹力y分量之和 |
EPSX | 归一化洛伦兹力x分量之和 |
汇集数据并生成最终数据集的方法
- 收集数据:该模块使用Python的Sun Py库从SWPC的数据集( GOES Event和SRS数据集)和JSOC的数据集SHARP中收集数据。包括2010年5月至2019年12月期间的数据。
- 分配正负事件:GOES Event数据。如果一个活动区在24小时内爆发了一个M -或X -级事件。赋值为属于正类。当分析24小时内的SHARP数据时,GOES Event数据上未报告为M -或X - Class事件的活动区域,模块将活动区域分配为属于负类事件。如果一个活动区域在一天中爆发了不止一个事件,将计数为几个不同的正事件。
- 数据集成:
I.选择事件:在"赋正负事件"模块后,从数据集"正负事件"中选择每个事件,与观测数据( SHARP数据集)进行融合。
Ⅱ.如果事件为正:
a .通过"保存的活动区域编号,选定事件开始的日期和时间"。从GOES Event数据集中包含的条目中选取。搜索SHARP数据集,并识别与引起正事件的活动区域相关的属性。
b .对于GOES Event数据集中的每个正事件( M -类或X -类),记录事件发生之前24小时内的记录。
Ⅳ.最后,将事件类型与观测数据进行融合。
问题
如果同时有好几个耀斑事件的标签,训练的时候选择哪一个来作为标签?