KEEL的.dat数据集怎么看文件头并用python读取

是我知白哒

于 2023-11-06 16:47:56 发布

阅读量295

点赞数 1

分类专栏： python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/Zb_Xl/article/details/134249393

版权

python 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

下载后的KEEL数据集用记事本打开会看到数据最上面有@符号的是文件头信息

1. @relation vowel 表示数据集的名称为vowel。

2. @attribute 后面跟着的是每个属性（即特征）的定义，包括属性名称、属性类型和属性取值范围等信息。例如，@attribute F0 real [-5.211, -0.941] 表示属性F0是一个实数类型，其取值范围在[-5.211, -0.941]之间。

3. @inputs 和 @outputs 分别定义输入和输出特征的名称，这里分别是TT, SpeakerNumber, Sex, F0, F1, F2, F3, F4, F5, F6, F7, F8, F9 和 Class。

4. @data 表示数据部分开始，后面的行都是数据记录，每行包含一个样本的特征值和对应的输出（即标签）。

使用pandas打开这个数据集：

import pandas as pd

# 读取数据文件并提取数据部分
data_lines = []
with open('D:/Users/Admin/Desktop/vowel.dat', 'r') as file:
    for line in file:
        if line.strip() == '@data':
            break
    for line in file:
        data_lines.append(line.strip().split(','))  # 使用逗号作为字段分隔符

# 获取属性名列表
attribute_names = ['TT', 'SpeakerNumber', 'Sex', 'F0', 'F1', 'F2', 'F3', 'F4', 'F5', 'F6', 'F7', 'F8', 'F9', 'Class']

# 为DataFrame的列命名
df = pd.DataFrame(data_lines, columns=attribute_names)

# 输出DataFrame
print(df)

是我知白哒

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
KEEL的.dat数据集怎么看文件头并用python读取

2. @attribute 后面跟着的是每个属性（即特征）的定义，包括属性名称、属性类型和属性取值范围等信息。例如，@attribute F0 real [-5.211, -0.941] 表示属性F0是一个实数类型，其取值范围在[-5.211, -0.941]之间。3. @inputs 和 @outputs 分别定义输入和输出特征的名称，这里分别是TT, SpeakerNumber, Sex, F0, F1, F2, F3, F4, F5, F6, F7, F8, F9 和 Class。
复制链接

扫一扫