背景
数据挖掘中python是一件利器,而pandas则是这个利器的刀剑,可想而知它的重要性,本节做一下它的helloworld。
本节重点:
- 数据接入
- 数据命令行简易打印
- 简易画图展示
数据接入
安装就带过了,不多赘述。
这里我使用的jupyter notebook
import pandas as pd
import sklearn
import datetime
import pandas_datareader.data as web
start = datetime.datetime(2010, 1, 1)
end = datetime.datetime(2015, 8, 22)
df = web.DataReader('XOM', 'yahoo', start, end)
# 这里经常会有pd.read_csv(file_path)来获取数据
如果本地有数据,可以通过read_csv的方法进行加载。
简易展示
使用head和tail可以看一下部分数据的概况(至少得确认下数据是可以用)
画图展示
import matplotlib.pyplot as plt
df['High'].plot()
plt.legend()
plt.show()
这里用到了数据帧(df)的plot方法,其实完全不必要,可以直接使用plt自己的方法,如下:
说白了,df的plot方法,最终使用的plt的plot方法,把数据通过numpy数组的形式送进去
评价
本文主要是helloworld,之后将继续走读,重点参考:https://www.yiibai.com/pandas