数据加载及探索性数据分析
这部分内容主要分:数据加载、Pandas基础、探索性数据分析。
1.导入numpy、pandas及查看python版本
import pandas as pd
import numpy as np
pd.__version__
2.通过绝对路径写入-读取CSV格式
df = pd.read_csv('data/table.csv')
df.head()
3.逐块读取
chunker = pd.read_csv('C:/Users/Lenovo/Desktop/titanic.csv', chunksize=1000)
通过pandas来处理文件的时候,我们经常会遇到大文件,这时候就需要用到逐块读取。
4.查看数据的基本情况
df.info()
5.观察表格前10行的数据
df.head(10)
6.观察表格后10行的数据
df.tail(10)
7.判断数据是否为空,为空的地方返回True,其余地方返回False
df.isnull().head()