文件批量处理

最新推荐文章于 2024-01-18 20:54:38 发布

eagle_sunzhang

最新推荐文章于 2024-01-18 20:54:38 发布

阅读量748

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/eagle_sunzhang/article/details/85243853

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

import tensorflow as tf
import numpy as np
import csv
import pandas as pd
import os
from sklearn.model_selection import train_test_split

train1 = pd.read_csv('0/2018-10-18.txt',sep='\t',header=None)
train2 = pd.read_csv('0/2018-10-19.txt',sep='\t',header=None)
train3 = pd.read_csv('0/2018-10-20.txt',sep='\t',header=None)
train4 = pd.read_csv('0/2018-10-21.txt',sep='\t',header=None)
train5 = pd.read_csv('0/2018-10-22.txt',sep='\t',header=None)
train6 = pd.read_csv('0/2018-10-23.txt',sep='\t',header=None)
train7 = pd.read_csv('0/2018-10-24.txt',sep='\t',header=None)
train8 = pd.read_csv('1/2018-10-18.txt',sep='\t',header=None)
train9 = pd.read_csv('1/2018-10-19.txt',sep='\t',header=None)
train10 =pd.read_csv('1/2018-10-20.txt',sep='\t',header=None)
train11 =pd.read_csv('1/2018-10-21.txt',sep='\t',header=None)
train12 =pd.read_csv('1/2018-10-22.txt',sep='\t',header=None)
train13 =pd.read_csv('1/2018-10-23.txt',sep='\t',header=None)
train14 =pd.read_csv('1/2018-10-24.txt',sep='\t',header=None)

test1 = pd.read_csv('0/2018-11-06.txt',sep='\t',header=None)
test2 = pd.read_csv('0/2018-11-07.txt',sep='\t',header=None)
test3 = pd.read_csv('1/2018-11-06.txt',sep='\t',header=None)
test4 = pd.read_csv('1/2018-11-07.txt',sep='\t',header=None)

train_0 = pd.concat([train1,train2,train3,train4,train5,train6,train7],axis=0)
train_1 = pd.concat([train8,train9,train10,train11,train12,train13,train14],axis=0)

train_0 = train_0.reset_index(drop=True)
train_1 = train_1.reset_index(drop=True)
#train_x,train_y = train.ix[:,0:10],train.ix[:,11]

test_0 = pd.concat([test1,test2],axis=0)
test_1 = pd.concat([test3,test4],axis=0)

test_0 = test_0.reset_index(drop=True)
test_1 = test_1.reset_index(drop=True)
#test_x,test_y = test.ix[:,0:10],test.ix[:,11]

f = open("test_1.txt",'a')
def func(_x):
    for i in range(_x.shape[0]):
        line = _x.ix[i]
        line = np.array(line)
        line = str(line)
        line = ','.join(line.split())
        line = line[1:-1]
        f.write(line)
        f.write('\n')
func(test_1)

import tensorflow as tf
import numpy as np
import csv
import pandas as pd
import os
from sklearn.model_selection import train_test_split

test =open('a.txt','r')

f1 = open("b.txt",'a')
f2 = open("c.txt",'a')

def func(_x,number):
    for i in range(number):
        line = _x.readline()
        if line[0] == ',':
            line = line[1:-1]
        else:
            line = line[0:-1]
        line1 = line[0:-2]
        line2 = line[-1]
        f1.write(line1)
        f1.write('\n')
        f2.write(line2)
        f2.write('\n')
#func(train,1106039)
func(test,111971)

eagle_sunzhang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文件批量处理

import tensorflow as tfimport numpy as npimport csvimport pandas as pdimport osfrom sklearn.model_selection import train_test_splittrain1 = pd.read_csv('0/2018-10-18.txt',sep='\t',header=None)...
复制链接

扫一扫