时间序列数据挖掘初探

最新推荐文章于 2024-01-16 01:51:01 发布

每天都要被自己菜醒

最新推荐文章于 2024-01-16 01:51:01 发布

阅读量351

点赞数

分类专栏：大数据文章标签：机器学习数据挖掘数据分析

本文链接：https://blog.csdn.net/qq_45531594/article/details/108446745

版权

本文探讨了时间序列数据挖掘，重点介绍了Python中的处理方法，如使用Pandas的resample方法和matshow()函数进行数据可视化，以及ag_plot()进行自相关性分析。通过滞后散点图和自相关曲线揭示数据间的周期性和季节性波动规律。

摘要由CSDN通过智能技术生成

链接: [https://www.jb51.net/article/164438.htm]

Pandas中resample方法详解

链接: [https://segmentfault.com/a/1190000012394176?utm_source=tag-newest]

在这里插入图片描述

在这里插入图片描述

# 调用pandas的read_csv函数读取数据集文件
df = pd.read_csv('C:/Users/lb/Desktop/test/temperature-min.csv')

df

在这里插入图片描述

df['Date'] = pd.to_datetime(df['Date']) #转换成时间格式
#将该时间作为索引 
df =df.set_index('Date')
df

在这里插入图片描述

# 设置绘图大小
plt.style.use({
   'figure.figsize':(20,8)})
#重采样 ,按月
df['1982'].resample('M').mean().T

在这里插入图片描述

#热力图
sns.heatmap(df['1982'].resample('M').mean().T)

#为什么6月和7月气温最低？
#因为墨尔本在澳大利亚，属于南半球，

关注