- 从外部读进来一个文件保存在列表中
b=[]
g = open('C:/Users/pxf/Desktop/text_mining_data2.txt','r',encoding='utf-8')
for line in g.readlines():
b.append(line)
- 将列表中的数据读出到该项目中,使用w,那么就会将光标每次移到文件数据的开头,也就是每次程序运行都会清空以前文件中保存的数据:
k = open('cc.text','w',encoding='utf-8')
for i in range(len(b)):
k.write(b[i])
注意:千万不能写成这样,因为这样只能写出数据的最后一行,因为每次循环都打开一次文件–>cc.text:
for i in range(len(b)):
with open('cc.text','w',encoding='utf-8') as k:
k.write(b[i])
- 如果想要每次的打开文件后以前的数据不清除,只是在原来的数据末尾进行添加,那么使用 a而不是w:
k = open('cc.text','a',encoding='utf-8')
for i in range(len(b)):
k.write(b[i])
- 还有一种使用pickle模块进行数据序列化写出存储与读取(使用pickle和一般的w,r比较相似,但是pickle多了一个可以存取程序运行过程中产生的对象信息;这个在本人pycharm 项目TextClassification中的preprocess.py模块中有应用),它要求必须是将源数据以二进制形式进行操作,文件后缀一般为.pkl
关于pickle的好处以及详解参考博客:https://blog.csdn.net/brucewong0516/article/details/79054373
# 序列化
with open('q.pkl','wb') as f:
pickle.dump(a,f)
# 反序列化
with open('q.pkl','rb') as f:
w = pickle.load(f)
print(w)
注意:生成的.pkl文件直接打不开,需要使用rb形式读出打印才能看到