UCi数据集处理技巧记录

如何起步使用UCI数据集

这里记录一下如何把带分号的数据变成经常使用的csv形式。这里使用wine的例子

https://archive.ics.uci.edu/dataset/186/wine+quality

原始数据 Wine

在这里插入图片描述

UCI数据操作

这种带分号的使用python的不好阅读,可以尝试以下步骤:
在这里插入图片描述

  1. 转变为txt文件,用替换的形式,将分号替换为逗号。
  2. 将文件形式转变为csv文件即可。

其次文件的头部可以改成字母。以下是在jupyter的python代码

import heapq
import datetime
import numpy as np
import pandas as pd
from sklearn import svm
from scipy.stats import spearmanr
from sklearn.model_selection import KFold
from sklearn.preprocessing import MinMaxScaler
from sklearn.neighbors import KNeighborsClassifier
from decimal import Decimal

# 读取数据 下载的UFD数据没有列名称,它把第一行当作了列名称,这里需要处理一下。
data = pd.read_csv(r"C:\Users\LCC\Desktop\wine.csv")
row1 =  data.columns.values
row1
# 将列名字改为字母顺序
columns_name = []
for i in range(len(row1)):
    columns_name.append(chr(ord('A')+i))
columns_name
#保存 这里默认根路径是桌面
data.columns = columns_name
data.to_csv("wine.csv")

改善后效果图

在这里插入图片描述

  • 7
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值