一、循环打开多个文件
要打开多个文件名类似的同一类型文件,暂时不会os包的操作,建立空list,用字符串的 format函数 & list的append 就可以了
filedfs_list = []
type = ['STATIONSEQNUM',"TIMEHEADWAY",'tag',"timeframe","ORDER"]
for i in range(3,10):
filedfs_list.append(pd.read_csv("080{}final.txt".format(i))[type])
二、dataframe 筛选
本质就是一个判段’[]'内条件是否为真的过程
1、判断result1[(result1[‘STATIONSEQNUM_y’] == 22 )&(result1[‘date’] == 4) 是否为真,这里要特别注意,多个判断语句时一定要加括号,不然条件模糊,无法判断,会返回什么 ambiguous 之类的错误
stxseq = int(result1[(result1['STATIONSEQNUM_y'] == 22 )&(result1['date'] == 4)]['STATIONSEQNUM_x'].values)
2、判断grouped1_df.groupby(‘date’)[‘tag’].rank(method = ‘min’, ascending = False)< 2 是否为真,为真,则返回grouped1_df对应行
result1 = grouped1_df[grouped1_df.groupby('date')['tag'].rank(method = 'min', ascending = False)< 2].reset_index()