KEEL的.dat数据集怎么看文件头并用python读取

下载后的KEEL数据集用记事本打开会看到数据最上面有@符号的是文件头信息

1. @relation vowel 表示数据集的名称为vowel。

2. @attribute 后面跟着的是每个属性(即特征)的定义,包括属性名称、属性类型和属性取值范围等信息。例如,@attribute F0 real [-5.211, -0.941] 表示属性F0是一个实数类型,其取值范围在[-5.211, -0.941]之间。

3. @inputs 和 @outputs 分别定义输入和输出特征的名称,这里分别是TT, SpeakerNumber, Sex, F0, F1, F2, F3, F4, F5, F6, F7, F8, F9 和 Class。

4. @data 表示数据部分开始,后面的行都是数据记录,每行包含一个样本的特征值和对应的输出(即标签)。

使用pandas打开这个数据集:

import pandas as pd

# 读取数据文件并提取数据部分
data_lines = []
with open('D:/Users/Admin/Desktop/vowel.dat', 'r') as file:
    for line in file:
        if line.strip() == '@data':
            break
    for line in file:
        data_lines.append(line.strip().split(','))  # 使用逗号作为字段分隔符

# 获取属性名列表
attribute_names = ['TT', 'SpeakerNumber', 'Sex', 'F0', 'F1', 'F2', 'F3', 'F4', 'F5', 'F6', 'F7', 'F8', 'F9', 'Class']

# 为DataFrame的列命名
df = pd.DataFrame(data_lines, columns=attribute_names)

# 输出DataFrame
print(df)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值