读取文件–python
1.txt文件
with open("./test.txt", "r") as f:
for line in f.readlines()[4:]:
line = line.strip('\n').strip('.').split(',')
test_data.append(line)
(1)strip()是用来忽略掉某个字符串,输出str字符串格式
(2)split()是根据指定的字符,进行分隔,输出list格式
(3)list读取就是直接append即可
(4)因为f.readlines返回的是list,所以可以实现只读文件的一部分
2.csv文件
with open('movies.csv','r', encoding='UTF-8') as movie:
data = csv.DictReader(f)
#data cleaning
for line in data:
j = line['userId']
# j = line['锘縰serId'] #为什么是乱码??? 用测试集的时候记得改过来,因为windows在csv文件头会自动添加EF BB BF这三个字节(文本编码识别码)
k = line['movieId']
v = line['rating']
movie_raw = csv.DictReader(movie)
(1)可以发现DictReader()是一个非常强大的读取工具,可以直接读取全部csv文件的内容,并且把第一行作为关键字保存到字典的key中,之后通过字典取值来获取制定列的每一行
3.npy的读取和保存
保存:转化为numpy然后np.save()【一般保存array形式的】
array = np.array(result)
np.save('E:/Harry/python test/assign2/problem B/node.npy', array)
读取:可以读取为array, tuple, dict
node_array = np.load("node.npy")
node_list = node_array.tolist()