1毕业设计-使用机器学习来估算建筑耗能(数据预处理篇)
我首先对论文中给出的数据进行了预处理,其中涉及了数据清洗相关内容。
紧接着下一步就是针对模型进行训练看哪一个更适合来预测。
1、可视化数据 画图问题
fig,ax = plt.subplots()
使用该函数确定图的位置
fig, ax = plt.subplots(1,3),其中参数1和3分别代表子图的行数和列数,一共有 1x3 个子图像。函数返回一个figure图像和子图ax的array列表。
2、统计函数
-
print('求和',arr.sum())
-
print('算数平均数',arr.mean())
-
print('标准差',arr.std()
3、条状图
bins = np.logspace(np.log10(1),np.log10(Y.max()),50)#确定条数
plt.hist(Y, bins=bins)#分布数据对应X轴
Y2 = distribution.rvs(Y.shape[0])#产生对应scipy.stats #生成指定分布
scipy.stats.poisson.rvs(loc=期望, scale=标准差, size=生成随机数的个数) #从泊松分布中生成指定个数的随机数的指数分布
4、数组判断筛选
np.where(condition, x, y)