pandas学习日记(二)

数据结构

Series结构

series是一种类似一维数组的结构,可以数据类型不同,类似原生python的列表

import pandas as pd
# 创建方式
# 方法一 (当index不填写时候以创建时下标位置作为索引)
s1 = pd.Series(data=[1,'a',5.4,9,"hello"],index=[x,y,z,....])

# 方法二 (使用字典,直接传值和索引)
#创建一个字典
sdata = {'Ohio': 3500, 'Texas': 72000, "Oregon": 16000, 'Utah': 5000}
s2 = pd.Series(sdata)

# 相关操作
# 输出 (以索引和数据作为一行输出)
print(s1)
# 查看索引
print(s1.index)
# 仅仅输出数据
print(s1.values)
# 输出索引对应的值 (一个索引可以只写一个[])
print(s1[[索引值1,索引值二]])

DataFrame结构

DataFrame是一种二维数组

import pandas as pd
# 创建方式
# 方法一 文件读取
# 查看pandas学习日记(一)

# 方法二 使用字典创建(字典中所有的值应该长度相同)
data = {
    'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
    'year': [2000, 2001, 2002, 2001, 2002],
    'pop': [1.5, 1.7, 3.6, 2.4, 2.9]
}
df = pd.DataFrame(data)

# 输出各个字段类型
print(df.dtype)
# 输出字段
print(df.columns)
# 索引
print(df.index)

# 查询操作
#	列查询
# 		单列
print(df["字段名"]) # df['字段名']实际上是返回的是Series类型的数据,用print(type(df['字段名'])可以查证)
# 		多列
print(df[["字段1","字段2","字段3",...]]) #因为是多列 返回的还是DataFram类型
#	行查询
#		单行
print(df.loc[行号])
#		多行
print(df.loc[xxx]) # xxx 是指的可以使用和原生python一样的索引切片
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mystic Musings

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值