链接:https://pan.baidu.com/s/1vQJ0oYds_ZnQZUozI8oFng
提取码:e6op
--来自百度网盘超级会员V3的分享
一、RML2018.01a介绍
共三个数据集,X、Y、Z
X是三维的,第一维有2555904条数据,第二维有1024条数据,第三维有2条数据。总共有2555904个信号,其中,共有24种调制方式,每个调制方式下有-20db至30db、步进2db信噪比范围共26个信噪比,每个信噪比下都有4096条信号样本。
其中每个信号样本有1024个数据(采1024个点),每个都由IQ两路数据组成。所以直接读取X数据集的张量形状(数组形状)为(2555904, 1024, 2)
Y是二维的,第一维度同样是2555904条数据,第二维度是24条数据。Y对应了X每个采样点的label,共24种调制方式,故采用24位的独热编码组成。直接读取Y的数据集张量形状为(2555904, 24)
Z也是二维的,第一维度是2555904条数据,第二维度是1。Z对应的是X中每个采样点的信噪比,所以只有一个数据构成。
二、精简数据集
1、精简调制方式
新的调制方式为:
classes = ['OOK','4ASK','8ASK','BPSK', 'QPSK','8PSK','32PSK','16APSK', '32APSK','64APSK','16QAM','AM-SSB-WC','AM-DSB-WC','AM-DSB-SC','FM', 'GMSK','OQPSK']
原本的调制方式为:
classes = [ 'OOK','4ASK','8ASK','BPSK', 'QPSK','8PSK','16PSK','32PSK','16APSK', '32APSK','64APSK','128APSK',
'16QAM', '32QAM','64QAM','128QAM','256QAM','AM-SSB-WC','AM-SSB-SC','AM-DSB-WC',
'AM-DSB-SC','FM', 'GMSK','OQPSK']
这里注意,直接去deepsig下载的数据集RF Datasets For Machine Learning | DeepSig
(通过这个链接可以直接去下载初始的RML2018,2016等数据集)
里面classes.txt中的调制方式顺序是存在错误的,详情可见:
[数据集勘误]RadioML2018.01数据集中classes排列问题_rml2018数据集_机智的小木子的博客-CSDN博客
ps:删除的基本都是那几个QAM调制,是调制信号识别时候导致正确率较低的重灾区。
2、精简信噪比
利用RML2018作为数据集进行训练的时候,我们通常采用比较高信噪比的进行训练,我这里把2db到30db的抽取了出来。
3、精简信号样本数
初始是每个信噪比下有4096个样本,这里是随机选取的1600个样本。
最后贴一个Chad Spooner对RML2018的分析
DeepSig’s 2018 Dataset: 2018.01.OSC.0001_1024x2M.h5.tar.gz – Cyclostationary Signal Processing