频数分布图_特征标准化后的频数分布

深度学习依赖历史特征数据。特征数据的质量通过频数分布图直观表现。

  1. 特征数据一般不能够直接进入神经网络,需要事前标准化处理。
  2. 标准化后的特征数据,虽然可以进入训练网络了,但是,如果数据太脏,会导致网络学习过程拉长、结构庞大、甚至崩溃。故需要在标准化化前,进行数据清洗。
  3. 数据清洗分为空间比较清洗、时间比较清洗。
  4. 空间比较清洗,使用knn,将梯度值很大的异常数据给清洗掉;
  5. 时间比较清洗,根据平稳时间序列思路,将相邻时间变化异常的数据给平滑掉。清洗前后的频数分布图,可以直观体验清洗前后的效果。
  6. 频数分布图,也对深度学习网络的clamp(min,max)层,提供剪裁依据。看看下边的图形就知道了。
  7. 仅仅空间、时间清洗是不够的,还需要同化分析。要素间的同化作用,可以弥补时间、空间残缺信息。让要素集合更加整齐。看看下边同化后的频数图,更光滑了。

import matplotlib.pyplot as plt

import netCDF4

import numpy as np

url="http://hxfcalf:8080/thredds/dodsC/data/calf/ft_std/2019/20191001/201910012300.nc"

f = netCDF4.Dataset(url)

sf_var = f.variables['sf']

sf = sf_var[:]

np_sf = np.array(sf).flat

plt.hist(np_sf, bins=500)

histg,bins = np.histogram(

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值