【科学数据库】pandas基础

pandas的常用数据类型

处理字符串,日期类型等等
常用数据类型:
Series 一维,带标签数组
DataFrame 二维,Series容器

Series创建

本质上是创建数组
在这里插入图片描述

在这里插入图片描述
指定索引用的格式是列表

字典自带索引
在这里插入图片描述
用字典创建Series:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
切片:注意以下 的区别:
在这里插入图片描述
在这里插入图片描述

例子:

在这里插入图片描述
数据存在csv中,使用 pd. read_csv 读取
读取后数据类型为DataFrame
以下结果和series不同,它有三列
在这里插入图片描述

读取数据库mysql中的数据:
pd.read_sql(sql_sentence,connection)

读取数据库mongodb中的数据:mongodb的数据可以传入DataFrame
在这里插入图片描述
注意:读取csv中数据读出的类型是DataFrame

DataFrame如何创建?----是series容器

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
index行索引
columns列索引

创建dataframe的两种方式:
1.通过字典创建
在这里插入图片描述
2.通过列表创建
在这里插入图片描述
DataFrame基础属性:
在这里插入图片描述
下图中的各项都可以单独求出:
如 t.mean()表示求t的平均值
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

例题:
在这里插入图片描述
在这里插入图片描述

pandas之取行或者列(loc和iloc)

以上文的狗子命名csv文件为例:
1.想单独研究使用次数前100的数据:在这里插入图片描述
2.具体选择某一列:df[" Count_AnimalName “]
3.同时选择行和列:df[:100][” Count_AnimalName "]

loc【行,列】—标签索引(标签是字符串,当行列的索引是字符串时 )

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

iloc【行,列】----位置索引(行列索引是数字)

在这里插入图片描述

pandas之布尔索引

实质就是索引值是bool值:比如 t【true】
例:狗名字使用次数在800~1000以内
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

pandas缺失数据的处理:

处理NaN:
先通过索引方式查找有缺失值的位置:
在这里插入图片描述
在这里插入图片描述

处理方式:
处理方式1:删除NaN所在的行列 t.dropna (axis=0, how=‘any’, inplace=False)—t是dataframe数据类型
axis=0表示删除有nan的行
how默认值是any,表示删除任何含有nan的行
inplace表示原地更新
在这里插入图片描述
在这里插入图片描述

处理方式2:填充数据,t.fillna(t.mean()) 用平均值填充
t.fiallna(t.median()) 用中位数填充
t.fillna(0) 用0或者其他指定值填充
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

处理为0的数据:
t[t==0]=np.nan-----把0变成nan,因为变成nan后计算均值等运算,就不会吧nan行参与运算,这样计算值会更准确
当然并不是每次为0的数据都需要处理,计算平均值等情况,nan是不参与计算的,但是0会

案例:pandas常用统计方法
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

统计方法和字符串离散化:

在这里插入图片描述
展现分布情况,一般可以使用直方图

import numpy as np
from matplotlib import pyplot as plt

runtime_data = np.array([8.1, 7.0, 7.3, 7.2, 6.2, 6.1, 8.3, 6.4, 7.1, 7.0, 7.5, 7.8, 7.9, 7.7, 6.4, 6.6, 8.2, 6.7, 8.1, 8.0, 6.7, 7.9, 6.7, 6.5, 5.3, 6.8, 8.3, 4.7, 6.2, 5.9, 6.3, 7.5, 7.1, 8.0, 5.6, 7.9, 8.6, 7.6, 6.9, 7.1, 6.3, 7.5, 2.7, 7.2, 6.3, 6.7, 7.3, 5.6, 7.1, 3.7, 8.1, 5.8, 5.6, 7.2, 9.0, 7.3, 7.2, 7.4, 7.0, 7.5, 6.7, 6.8, 6.5, 4.1, 8.5, 7.7, 7.4, 8.1, 7.5, 7.2, 5.9, 7.1, 7.5, 6.8, 8.1, 7.1, 8.1, 8.3, 7.3, 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值