提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
信息熵
确实傻子都能看懂,比如我
信息熵用于表示随机变量不确定性,即信息熵越大则变量的不确定性越大,即包含的信息量越大
相对熵
相对熵又成为KL散度、KL距离,常常在图像和音频中描述两个分布的差距。用于描述q(x)对于p(x)的拟合程度、如果两个分布差异越大,那么相对熵越大
如果当预测的q(x)和真实p(x)完全相同,那么KL散度的值为0
KL散度有个致命的问题,那就是当两个分布差距过于大的时候,此时KL散度没有意义了,因为太大了。
为什么要补零
时域补零相当于频域插值
1.补零可以增加频率分辨率
2.防止频谱泄露
频率分辨率
栅栏效应
相对于连续的频谱曲线我们只能观察到一系列离散点值
二、使用步骤
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。