现在您已经熟悉了编码环境,接下来学习如何制作自己的图表!
在本教程中,您将学习怎样用Python来创建专业的线形图。在接下来的练习中,您将使用您的新技能来处理真实世界的数据集。
准备好笔记本
我们首先设置编码环境。import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")
选择一个数据集
本教程的数据集是采用音乐流服务Spotify上的全球每日流行歌曲。 我们专注于2017年和2018年的五首流行歌曲:"Shape of You", by Ed Sheeran
"Despacito", by Luis Fonzi
"Something Just Like This", by The Chainsmokers and Coldplay
4."HUMBLE.", by Kendrick Lamar"Unforgettable", by French Montana
请注意,第一个出现的日期是2017年1月6日,与Ed Sheeran的《Shape of You》的发行日期相对应。而且,通过这个表格,你可以看到《Shape of You》在发行当天在全球被播放了12,287,078次。请注意,其他歌曲在第一行中缺少值,因为它们发布比较晚!
加载数据
正如您在上一篇教程中了解到的,我们使用pd.read_csv命令加载数据集。# Path of the file to read
spotify_filepath = "../input/spotify.csv"
# Read the file into a variable spotify_data
spotify_data = pd.read_csv(spotify_filepath, index_col="Date", parse_dates=True)
运行上述两行代码的最终结果是,我们现在可以通过使用spotify_data访问数据集。
检查数据
我们可以使用您在上一个教程中学习的head命令打印数据集的前五行。# Print the first 5 rows of the data
spotify_data.head()
输出: