1.数据载入及初步观察
1)数据加载
(1)载入数据
在conda环境中下载numpy及pandas两个库
【1】 导入numpy和pandas:
import numpy as np
import pandas as pd
【2】载入数据
使用相对路径载入数据
使用绝对路径载入数据
df=pd.read_csv(r'')
df
(2)初步观察
【1】查看数据的基本信息
使用函数:df.info()
【2】观察表格前几行的数据和后几行的数据
使用函数:df.head()
df.tail()
【3】判断数据是否为空,为空的地方返回True,其余地方返回False
使用函数:df.isnull().head()
(3)保存数据¶
【1】将你加载并做出改变的数据,在工作目录下保存为一个新文件train_chinese.csv
df.to_csv('train_chinese.csv')
2.pandas基础
3.pandas探索性数据分析
聚合运算
- 内置的聚合函数
- sum() 求和
- mean() 求平均值
- max() 求最大值
- min() 求最小值
- describe() 对每个分组进行聚合(返回n个聚合结果)
- 自定义聚合函数