Python的一些应用 jupyter notebook源码
总体思想:将内容转为dataframe,使用to_csv()函数进行存储,使用read_csv()或read_excel()进行读取
代码:
import pandas as pd
# 假设有文本text
text = ['这是一个文本内容','dsds']
# 转为DataFrame格式
text = pd.DataFrame(text)
'''
存储文件
'''
# 利用dataframe的to_csv存为不同形式的文件 index表示索引,header表示表头 encoding表示编码格式
text.to_csv('text.txt',sep='\t',index=False, header=None)
text.to_csv("test.csv",index=False,sep=',', header=None,encoding="utf-8") #编码格式还有 gb2312
text.to_excel('new.xls',index=False,header=None)
# 如果缺xlwt模块 ,使用pip install xlwt安装
'''
读取txt文件
'''
df = pd.read_csv("text.txt", sep=',', header=None)
f = open('text.txt',encoding='utf-8')
print(f.read()) #还有readline() readlines()
f.close()
'''
读取其余两个文件
'''
df = pd.read_csv("test.csv", sep=',', header=None,encoding='utf-8')
df = pd.read_excel('new.xls',header=None)