有一个按每周更新的销量数据库,数据字段按照每周的时间命名,数据字段是变化的,需要计算最近每10周的平均值,由于每周字段名是随着时间的增长动态变化的,因此不能用之间引用列名的方式计算平均销量。
因此用Pandas readsql()的方法根据sql语句把数据读取到pandas里,然后用pandas的列号索引计算平均值。方法如下:
conn = connect_mysql()
df=pd.read_sql(sql=sql,con=conn,index_col='产品代码')
#新增一列”平均周销量“,按行计算顺数第2列至倒数第3列的平均值
df['平均值']=df.iloc[:,2 :-3].mean(axis=1,skipna=True,numeric_only=True).astype(int) #倒数3列不是数值,不用求平均值,结果转化为整数。