Pandas(个人笔记)

本文介绍了如何使用Python的numpy和Pandas库,重点讲解了Series类的对象创建、属性、方法,如isnull()和loc/iloc取值,以及DataFrame的创建、取值方式和常用操作。涵盖了数据结构、数据分析和数据处理的基础内容。
摘要由CSDN通过智能技术生成

import numpy as np,pandas as pd

(一般的,numpy包和Pandas包一起导入使用)

zip()把参数里的序列以类似字典的元组压缩起来

Series类对象

++pd.Series创建一个新对象(驼峰命名)++

  1. Series(X,Y,Z)参数:
    • X 是写入的数据 一般为序列
    • Y 是索引的数据 可以写入序列 默认为下标
    • Z 是指定数据的类型
    • X,Y可以用字典类型数据代替 指定字典后 再赋值索引参数可多可少 缺省值用Nan代替(猜测原理为 传字典时表已经创好 是键值对应的, 再次赋值相当于表已经创好二次赋值,如果不传字典表没完成构建 需要对应的键值对来创表 所以必须对应 )
  2. Series属性:
    • index 表的下标属性 返回一个下标组成的序列
    • values 值属性 返回一个序列 与index的返回值都可以用下标获取
  3. Series方法:
    • isnull() 判断值是否为空 返回一个bool序列
    • notnull() 与上相反
    • any() 判断bool序列是否有Turn 返回一个bool值
      np.isnan() 等同于Series的isnull()方法
  4. Series 的遍历
    • 与字典遍历类似

DateFrame

  • DataFrame的创建
data = {'city': ['北京', '北京', '北京', '上海', '上海', '上海'],
        'year': [2000, 2001, 2002, 2001, 2002, 2003],
        'population': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data,['A', 'B', 'C', 'D', 'E', 'F'])
df
第一个参数为数据 一般为字典 键为列字段 值为列下的数据
#结果

	city	year	population
A	北京	2000	1.5
B	北京	2001	1.7
C	北京	2002	3.6
D	上海	2001	2.4
E	上海	2002	2.9
F	上海	2003	3.2
  • DataFrame的取值 loc[]和iloc[]
    • loc[ X ] (类属性方法)里面传指定索引(可切片 花式索引等)
    • iloc [] loc方法的原本索引(数字)形式
df[['city','population']]
#结果
    city	population
A	北京	1.5
B	北京	1.7
C	北京	3.6
D	上海	2.4
E	上海	2.9
F	上海	3.2

df.iloc[1:4,2:4]
#结果
	population
B	1.7
C	3.6
D	2.4
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值