人生苦短,我用python
python 安装包+资料:点击此处跳转文末名片获取
一、数据概览
咖啡是一种用烘焙过的咖啡豆、
咖啡属某些开花植物的浆果种子调制而成的饮料。
从咖啡果实中分离出种子,
生产出一种稳定的、未经烘焙的生咖啡。
然后将种子进行烘焙,
这一过程将它们转化为一种可消费的产品:焙烤咖啡,
将其磨成细颗粒,
通常在热水中浸泡,
然后过滤,形成一杯咖啡。
咖啡价格数据从2000年1月2022年5月。
在本例中我们使用pandas
、pyplo
t、seaborn
进行数据可视化,
绘制折线图、柱状图、散点图,
我们可以观察1、日、月、季度、年 咖啡价格,
Open-High-Low-Close-Vol
每日咖啡价格,
Open\High\Low\Close\Vol
,
Low-Close
,High-Close
,Open-Close
关系。
plt.plot() kind的参数:
- "
area
"用于面积图。 - "
bar
"用于垂直条形图。 - "
barh
"用于水平条形图。 - "
box
"用于箱形图。 - "
hexbin
"用于六边形图。 - "
hist
"用于直方图。 - "
kde
"用于核密度估计图。 - "
density
"是"kde"的别名。 - "
line
"用于折线图。 - "
pie
"用于饼图。 - "
scatter
"用于散点图
二、数据预处理
import pandas as pd
df = pd.read_csv('./data/coffee.csv')
# df.info()
# print(df.shape) # (5671, 7)
# print(df.describe())
# print(df.columns) #Index(['Date', 'Open', 'High', 'Low', 'Close', 'Volume', 'Currency'], dtype='object')
# print(len(df.Date.unique())) #5671
# print(df.Currency.unique()) #['USD']
三、数据可视化
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False
df = pd.read_csv('./data/coffee.csv')
df.Date = pd.to_datetime(df.Date, yearfirst=True)
df.set_index('Date', inplace=True)
日、月、季度、年 咖啡价格
fig, axes = plt.subplots(2, 2, figsize&