Python Ecosystem之数据处理

高亮颜色说明:突出重点
个人觉得,:待核准个人观点是否有误
高亮颜色超链接

曲线平滑

从TensorBoard的summary中提取数据,并使用滑动平均法平滑曲线

20210915记:
  tensorboard_summary_data_process_statistics.py
  tensorboard_summary_data_process_smooth.py

正态检验 (Normality Test)

衡量数据的分散程度

20230411记:
  衡量数据的分散程度。谷歌检索"plot to measure the dispersion of data;"
  分散度量(Measures of Dispersion)度量数据的分散程度,即数据分布中的值有多远。范围(Range)、四分位距(IQR, Interquartile Range)、方差(Variance)和标准偏差(Standard Deviation/Squared Deviation)是用于理解数据分布的方法。

  • Range = Highest_value – Lowest_value;
  • IQR = Q3 - Q1;
  • 方差度量数据集中每个数据点与平均值的距离;
  • 标准差是原始值的方差的平方根,低标准差表示数据点接近均值。
  • 平均绝对偏差(Mean Absolute Deviation)的问题在于,它不是可微分的,而且它在正态分布中不如平方偏差(Squared Deviation)所拥有的数学属性表现好(???)。
  • 平方能够放大存在巨大偏差的数据点的影响。
  • 总体方差的计算公式中是除以n,样本方差的计算公式中是除以n-1,'-1’表示丢失了一个自由度的意思,因为在已知n-1个样本的时候,剩余的那个样本的取值会受到样本均值的约束,而不会受到总体均值的约束。

参考:

二级标题

  

待补充

  

待补充

  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值