pandas是python的一个科学计算包,是一个强大的数据分析工具,常用于数据挖掘。
导入Pandas的标准方式:import pandas as pd
数据类型:series和dataframe
series:一维的数据类型,每个元素都有一个标签,series类似于Numpy中元素带标签的数组(标签可以是数字或者字符串) dataframe:二维的表结构,Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签
2.读取cvs文件和处理缺失值
2.1读取cvs文件
data=pd.read_cvs(‘file_path’)
读取cvs文件,会使用浮点值“NaN”来表示浮点或非浮点数组中的缺失值
2.2处理缺失值
处理NaN的方法有四种: dropna, drop, isnull, notnull
is(not)null:这一对方法对对象做出元素级的应用,然后返回一个布尔型数组,一般可用于布尔型索引。