这里写自定义目录标题
读取mat文件
最近,帮博士师兄处理数据集,场景是,他下好了开源的数据集,但是需要处理成自己的实验的数据:
1.从6个text(分别是训练集和测试集的图像特征、文字特征和对应的标签)文件中读取数据,并写入mat文件
2.从6个mat(分别是训练集和测试集的图像特征、文字特征和对应的标签)文件读取制作好的数据,并合并写入同一个mat文件(源mat是5.0版本的,而目标是7.3版本的)
text----》mat
import numpy as np
# array=numpy.loadtxt(r'E:\NUSWIDE\training_data_NUS_WIDE\feature\train_img.txt')
# print(array.size)
from numpy import *
import hdf5storage
import scipy.io as sio
def I_tr(path):
file = open(path)
filelist = file.readlines()
lenghth = len(filelist)
to_mat= zeros((lenghth,4096)) #这里4096指想要转化成矩阵是2列的,数据是几列就初始化成几。
index = 0
file = open(path)
for data in file.readlines():
data = data.strip('/n')
nums = data.split(" ")
#print(type(nums))
#print(nums)
nums=np.array(nums)
nums=nums[:-1]
#print(len(nums))
#print(type(nums))
#print(nums)
nums = [float(x) for x in nums]
to_mat[index,:] = nums[:]
index +=1
#print(to_mat)
# print(type(to_mat))
to_mat = matrix(to_mat)
# print(to_mat)
# print(type(to_mat))
print(len(to_mat))#行数
print(shape(to_mat)[1])
print(len(to_mat.T))#转置后,行数
print(shape(to_mat.T)[1])
return to_mat
def T_tr(path):
file