目录
数据可视化
是通过图形展示数据的一种方式,能够帮助我们快速理解数据的内在规律和趋势。整个数据可视化流程可以分为以下几个步骤:
获取数据:数据可能来自不同的来源,比如文件(CSV、Excel)、数据库、API 等。数据通常会存储为结构化或非结构化的形式。
数据清洗:实际数据通常会有缺失值、不一致的格式等问题。在可视化之前,我们需要清理数据,处理缺失值、异常值,确保数据质量。
选择合适的图表类型:根据数据类型和分析目的,选择适合的数据可视化图表。常见的图表类型有折线图、柱状图、散点图、热力图等。
绘制图表:使用编程语言和数据可视化工具来生成图表。在 Python 中,常用的可视化工具有 Matplotlib、Seaborn 等。
解释结果:通过图表直观地展示数据的趋势、分布或关系,从而得出结论并做出决策。
1.气温数据可视化
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.family' ] = 'Arial Unicode MS'
np.random.seed(0)
dates = pd.date_range(start='2024-03-01',periods=31,freq='D')
temperature1 = (31,30,31,32,35,35,36,35,31,33,30,25,29,25,30,34,36,38,32,34,31,35,35,31,35,36,31,32,36,35,29,)
plt.figure(figsize=(16, 6))
temperature2 = (20,25,22,26,19,19,29,19,19,19,15,19,21,19,19,21,26,27,19,19,30,28,29,19,19,21,34,23,19,19,20)
plt.figure(figsize=(16,6))
plt.plot(dates,temperature1,label='气温',color='blue')
plt.xlabel('日期')
plt.ylabel('气温(摄氏度)')
plt.title(' 3月气温走势(最高)')
plt.legend()
plt.figure(figsize=(