数据科学库3、pandas入门（2）

最新推荐文章于 2024-06-14 20:44:16 发布

qq_42749341

最新推荐文章于 2024-06-14 20:44:16 发布

阅读量97

点赞数

分类专栏：数据科学库

本文链接：https://blog.csdn.net/qq_42749341/article/details/107447313

版权

数据科学库专栏收录该内容

16 篇文章 0 订阅

订阅专栏

一、在 ipython notebook 环境下 pandas的快速入门

1.打开ipython notebook 操作

1.在windows命令窗口下输入
在这里插入图片描述
2.点击New，Python3

与ipython相比有优势如下：
1.一个编辑框可以轻松编写多行程序
2.如果画图图片可以直接显示在这个网页上

#图片直接画在网页上
%matplotlib inline

#导入包
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt

2.处理丢失数据

1) 构造出二维的DataFrame ,其中包含一些空数据

dates=pd.date_range('20160301',periods=6)
df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))
df

在这里插入图片描述
重新索引

df1=df.reindex(index=dates[0:4],columns=list(df.columns)+['E'])
df1

在这里插入图片描述
构造出二维的DataFrame，其中包含一些空数据

df1.loc[dates[1:3],'E']=2
df1

在这里插入图片描述

2) 删除任何缺少数据的行-返回复制的

df1.dropna()

在这里插入图片描述

3) 填充丢失的数据–返回复制的

df1.fillna(value=5)

在这里插入图片描述

4) 判断一个数据集里面是否包含有空数据

pd.isnull(df1)

在这里插入图片描述
数据很多时

3.数据运算

1）空数据不参与运算

2）平均值

在这里插入图片描述
按行求平均值

3）累加值

按列求累加值
在这里插入图片描述

4）广播及shift函数

对具有不同尺寸且需要对齐的对象进行操，pandas会自动沿指定尺寸广播

shift函数是对数据进行移动操作
在这里插入图片描述

5）将函数用于数据-apply

把一个列作为参数交给函数处理
在这里插入图片描述

6）直方图化

产生20个由10-20之间随机数构成的series数据结构
在这里插入图片描述
各个数字产生了多少个

产生最多的数字

7）字符串的处理方法

对数组的每个元素进行操作
str中的模式通常默认情况下使用正则表达式（在某些情况下始终使用正则表达式）
在这里插入图片描述

4.数据合并

在这里插入图片描述

1）SQL合并

在这里插入图片描述

2）插入一行

在这里插入图片描述

5.数据分组统计

在这里插入图片描述
通过A来分组，并将sum()功能应用于结果组

多列分组形成一个层次结构索引

6数据整形

在这里插入图片描述
创建双层索引

stack()方法压缩DataFrame列中的级别

unstack()转换回来

7.数据透视

在这里插入图片描述
以原数据表中A，B为行索引，C为列索引，针对D的数据

探究上面数据是怎么算出来的

8.时间序列

创建600个以秒为单位的时间序列
在这里插入图片描述
创建值于上面时间序列对应

以求和的方式重新采样

创建以季度为单位的时间序列

转化为时间日期得格式

9.类别数据-category

Categorical 是 pandas 0.15 版本才加入的新功能。用来表达类别数据
在这里插入图片描述
类别重命名

根据值来排序

10.数据可视化

在这里插入图片描述

11.导入、导出数据（获得数据的输入和输出）

1）CSV

写入csv文件
在这里插入图片描述
从csv文件中读取
从文件中读取，以第0列作为索引

qq_42749341

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据科学库3、pandas入门（2）

pandas一、在 ipython notebook 环境下 pandas的快速入门1.打开ipython notebook 操作2.处理丢失数据1) 构造出二维的DataFrame ,其中包含一些空数据2) 删除任何缺少数据的行-返回复制的3) 填充丢失的数据--返回复制的4) 判断一个数据集里面是否包含有空数据3.数据运算1）空数据不参与运算2）平均值3）累加值4）广播及shift函数5）将函数用于数据-apply6）直方图化7）字符串的处理方法4.数据合并1）SQL合并2）插入一行5.数据分组统计6数
复制链接

扫一扫

专栏目录