import warnings
warnings.filterwarnings(‘ignore’)
如遇到导包报错 可以看看是不是自己的第三方库的版本问题
设置图表与 线格式
plt.rcParams[‘figure.figsize’] = (10, 10)
plt.rcParams[‘lines.linewidth’] = 2
plt.style.use(‘ggplot’)
读取数据集
df = pd.read_csv(‘./DOGE-USD.csv’)
df.head() # 查看前5行
| | Date | Open | High | Low | Close | Adj Close | Volume |
| — | — | — | — | — | — | — | — |
| 0 | 2014-09-17 | 0.000293 | 0.000299 | 0.000260 | 0.000268 | 0.000268 | 1463600.0 |
| 1 | 2014-09-18 | 0.000268 | 0.000325 | 0.000267 | 0.000298 | 0.000298 | 2215910.0 |
| 2 | 2014-09-19 | 0.000298 | 0.000307 | 0.000275 | 0.000277 | 0.000277 | 883563.0 |
| 3 | 2014-09-20 | 0.000276 | 0.000310 | 0.000267 | 0.000292 | 0.000292 | 993004.0 |
| 4 | 2014-09-21 | 0.000293 | 0.000299 | 0.000284 | 0.000288 | 0.000288 | 539140.0 |
df.isnull().sum() # 统计缺失值的总和(sum())
Date 0
Open 5
High 5
Low 5
Close 5
Adj Close 5
Volume 5
dtype: int64
df.duplicated().sum() # 查看重复值
0
数据类型 分布基本情况
df.info()
<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 2591 entries, 0 to 2590
Data columns (total 7 columns):
Column Non-Null Count Dtype
— ------ -------------- -----
0 Date 259