机器学习-数据科学库(第4节)

一、pandas是什么?

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
常用数据类型:
Series 一维,带标签数组
DataFrame 二维,Series容器

二、Series创建

在这里插入图片描述
在这里插入图片描述

三、pandas之Series切片和索引

在这里插入图片描述
在这里插入图片描述

四、pandas之读取外部数据

数据存在csv中,直接使用pd. read_csv即可
对于数据库比如mysql或者mongodb中数据:pd.read_sql(sql_sentence,connection)

五、pandas之DataFrame

DataFrame对象既有行索引,又有列索引
行索引,表明不同行,横向索引,叫index,0轴,axis=0
列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
在这里插入图片描述
在这里插入图片描述

六、pandas之取行或者列

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

七、pandas之布尔索引

在这里插入图片描述

八、pandas之字符串方法

在这里插入图片描述

九、缺失数据处理

判断数据是否为NaN:pd.isnull(df),pd.notnull(df)

处理方式1:删除NaN所在的行列dropna (axis=0, how=‘any’, inplace=False)
处理方式2:填充数据,t.fillna(t.mean()),t.fiallna(t.median()),t.fillna(0)
处理为0的数据:t[t==0]=np.nan
当然并不是每次为0的数据都需要处理
计算平均值等情况,nan是不参与计算的,但是0会

十、常用统计方法

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值