涉及pandas和文件IO和正则Re:
手动在项目路径下新建“下载21.11.12纽约时报-时间正文的文章”文件夹
import pandas as pd
import re
data = pd.DataFrame(pd.read_excel('纽约时报.xlsx', 'Sheet1'))
#print(data)# 查看读取数据内容
# print(data.values[0:, 0])#取第一列
# print(data.values[0:,1])#取第2列
# #print(data.iloc[0].at['正文']#取一个空格
row = 0
i=1
for row in range(len(data)):
column_str = str(data.iloc[row].at['时间'])+"\n"+"\n"+str(data.iloc[row].at['正文'])
#print(column_str)
#print(type(column_str))
with open("./"+"下载21.11.12纽约时报-时间正文的文章"+"/" +re.sub(r'[/\:*"<>|?\n]*', '',str(data.iloc[row].at['Title'])) +".txt", "w",encoding="utf-8") as f:
print("正在保存txt" )
f.write(column_str)
print("已保存txt" )
i+=1
f.close()