机器学习数据科学库2——pandas1

最新推荐文章于 2023-04-13 23:34:17 发布

ksh1994

最新推荐文章于 2023-04-13 23:34:17 发布

阅读量329

点赞数

分类专栏： pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46976767/article/details/106322572

版权

目录

使用ipython演示

创建pandas对象

创建一个日期序列

创建二维数组

使用ipython notebook演示

处理丢失数据

使用ipython演示

import pandas as pd

import numpy as np

创建pandas对象

创建序列

Series在pandas里面是一个序列

s=pd.Series([1,3,5,np.NaN,8,4]) NaN ：空值

创建一个日期序列

dates=pd.date_range('20160301',periods=6) 包括起始日期20160301，一共6个日期

创建二维数组

方法1：data=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) 创建一个6行4列的随机数组，索引的行是上面设置的dates，列是ABCD

得出数组：

方法2：

d={'A':1,'B':pd.Timestamp('20130301'),'C':range(4),'D':np.arange(4)}

df=pd.DataFrame(d)

查看数据

df.dtypes 访问所有列的数据类型

df.A 访问A列的值

data.head() 默认访问前五行数据，括号内输入数字可以决定访问前几行

data.tail() 访问后面几行

data.index 行标签

data.columns 列标签

data.values 访问值

data.describe() 看到数组的一些特征，比如平均值最大值最小值方差

data.T 转置

data.shape 行数列数

data.sort_index(axis=1) 按列标签排序，升序

data.sort_index(axis=1，ascending=False) 降序

data.sort_values(by='A') 按A列排序

选择数据

data.A 或者data['A'] 选取A列

data[2:4] 选取2到4行

data['20160302':'20160305'] 按行标签选

data.loc['20160302':'20160305'] 相比较上面而言效率高，因为loc只识别行或者列标签 data.loc[2:4] 报错

data.iloc[2:4] 可以，只能识别内置标签，不识别行列

data.loc['20160302':'20160305'，[

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习数据科学库2——pandas1

pandas
复制链接

扫一扫

专栏目录

ksh1994 CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

16万+: 周排名

220万+: 总排名

5210: 访问

: 等级

133: 积分

3: 粉丝

2: 获赞

0: 评论

26: 收藏

私信

关注

热门文章

分类专栏

最新评论

机器学习算法基础
qwmwysr: 一课讲透机器学习概率统计，快速打造算法基础核心能力(附源码) 下载地址：https://download.csdn.net/download/hnmwykka/85290940

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。