文章目录
一、pandas是什么?
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
常用数据类型:
Series 一维,带标签数组
DataFrame 二维,Series容器
二、Series创建
三、pandas之Series切片和索引
四、pandas之读取外部数据
数据存在csv中,直接使用pd. read_csv即可
对于数据库比如mysql或者mongodb中数据:pd.read_sql(sql_sentence,connection)
五、pandas之DataFrame
DataFrame对象既有行索引,又有列索引
行索引,表明不同行,横向索引,叫index,0轴,axis=0
列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
六、pandas之取行或者列
七、pandas之布尔索引
八、pandas之字符串方法
九、缺失数据处理
判断数据是否为NaN:pd.isnull(df),pd.notnull(df)
处理方式1:删除NaN所在的行列dropna (axis=0, how=‘any’, inplace=False)
处理方式2:填充数据,t.fillna(t.mean()),t.fiallna(t.median()),t.fillna(0)
处理为0的数据:t[t==0]=np.nan
当然并不是每次为0的数据都需要处理
计算平均值等情况,nan是不参与计算的,但是0会