python txt转dataframe_Python:dataframe和libsvm转换,pythondataframe,与

最新推荐文章于 2024-06-01 22:34:05 发布

weixin_39709674

最新推荐文章于 2024-06-01 22:34:05 发布

阅读量214

收藏

点赞数

文章标签： python txt转dataframe

1、dataframe to libsvm

首先我们看下目标数据

2.0000001.00000038.50000054.00000020.0000000.0000001.0000002.0000002.0000003.0000004.0000001.0000002.0000002.0000005.9000000.0000002.00000042.0000006.3000000.0000000.0000001.000000

一共22列，最后一列尾标签

我们先读入数据转换成dataframe格式【当然也可以直接转换libsvm】

import pandas as pd

import os

#读入TXT文件

file_name = "***Test.txt"

file_data = open(file_name, 'r')

data=[]

for line in file_data.readlines():

features = line.strip().split('\t')

data.append(features)

#存储到list

df=pd.DataFrame(data)

cwd = os.getcwd()#获取当前路径

libsvmtxt = cwd + '/libsvm.txt'#创建一个TXT文件

f=open(libsvmtxt,'w')

num=df.shape[0]

columns=df.shape[1]

label = df[columns-1]

for j in range(num-1):

libsvm = ''

for i in range(columns-1):

libsvm += " %d:%s" % (i, df[i][j])

#print (svm_format)

svm_format = "%s%s\n" % (label[j], libsvm)

f.write(svm_format)#写入

这样就可以得到需要的libsvm格式了

2、 libsvm to dataframe

我们直接使用load_svmlight_file

from sklearn.datasets import load_svmlight_file

from pandas import DataFrame

import pandas as pd

file_name = cwd + '/libsvm.txt'

X_train, y_train = load_svmlight_file(file_name)

这样直接得到的数据是sparse matrix

需要转化一下

mat = X_train.todense()

#X

df1 = pd.DataFrame(mat)

#y

df2 = pd.DataFrame(y_train)

df2.columns = ['target']

#合在一起

df = pd.concat([df2, df1], axis=1) # 第一列为target

df.to_csv("df_data.txt", index=False)

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0FuZHlfc2hlbnps,size_16,color_FFFFFF,t_70

Python sklearn.datasets.dump_svmlight_file() Examples：

weixin_39709674

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值