时间序列 数据挖掘初探

本文探讨了时间序列数据挖掘,重点介绍了Python中的处理方法,如使用Pandas的resample方法和matshow()函数进行数据可视化,以及ag_plot()进行自相关性分析。通过滞后散点图和自相关曲线揭示数据间的周期性和季节性波动规律。
摘要由CSDN通过智能技术生成

链接: [https://www.jb51.net/article/164438.htm]

Pandas中resample方法详解

python 处理数据的风骚操作:

链接: [https://segmentfault.com/a/1190000012394176?utm_source=tag-newest]

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

matshow()这是一个把矩阵或数组绘制成图像的函数

在这里插入图片描述
在这里插入图片描述

ag_plot()用于时间序列的自相关性分析,可以描绘pandas对象series中当前值和滞后值之间的散点图

# 调用pandas的read_csv函数读取数据集文件
df = pd.read_csv('C:/Users/lb/Desktop/test/temperature-min.csv')

df

在这里插入图片描述

df['Date'] = pd.to_datetime(df['Date']) #转换成时间格式
#将该时间作为索引 
df =df.set_index('Date')
df

在这里插入图片描述

# 设置绘图大小
plt.style.use({
   'figure.figsize':(20,8)})
#重采样 ,按月
df['1982'].resample('M').mean().T

在这里插入图片描述

#热力图
sns.heatmap(df['1982'].resample('M').mean().T)

#为什么6月和7月气温最低?
#因为墨尔本在澳大利亚,属于南半球,
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值