task:水压站点的特征工程
df1和df2中分别给出了18年和19年各个站点的数据,其中列中的H0至H23分别代表当天0点至23点;df3中记录了18-19年的每日该地区的天气情况,请完成如下的任务:
import pandas as pd
import numpy as np
df1 = pd.read_csv(‘yali18.csv’)
df2 = pd.read_csv(‘yali19.csv’)
df3 = pd.read_csv(‘qx1819.csv’)
通过df1和df2构造df,把时间设为索引,第一列为站点编号,第二列为对应时刻的压力大小,排列方式如下(压力数值请用正确的值替换):
import re
number_list=[]
for i in range(len(df_new.iloc[:,0])):
number=re.findall(r"\d+",str(df_new.iloc[i,0]))
number_list.append(number[0])
number_int=[int(x) for x in number_list]#转换为数字
df_new.iloc[:,0]=number_int
for j in range(int(len(df_new)/max(number_int))):
df_new.iloc[max(number_int)*(j):max(number_int)*(j+1),:]=df_new.iloc[max(number_int)*(j):max(number_int)*(j+1),:].sort_values(by='MeasName')
排序结果:
df_new: