pandas之DataFrame

常见的数据类型:

  • 一维: Series
  • 二维: DataFrame
  • 三维: Panel …
  • 四维: Panel4D …
  • N维: PanelND …

1. 创建DataFrame数据类型

DataFRame对象里面包含两个索引, 行索引(0轴, axis=0), 列索引(1轴, axis=1)

方法1: 通过列表创建
import pandas as pd
import numpy as np
li = [
    [1, 2, 3, 4],
    [2, 3, 4, 5]
]
d1 = pd.DataFrame(data=li, index=['A', 'B'], columns=['views', 'loves', 'comments', 'tranfers'])
print(d1)
方法2: 通过numpy对象创建
narr = np.arange(8).reshape(2, 4)
d2 = pd.DataFrame(data=narr, index=['A', 'B'], columns=['views', 'loves', 'comments', 'tranfers'])
print(d2)
方法三: 通过字典的方式创建
dict = {
    'views': [1, 2, ],
    'loves': [2, 3, ],
    'comments': [3, 4, ]

}
d3 = pd.DataFrame(data=dict, index=['粉条', "粉丝"])
print(d3)

在这里插入图片描述

2. 日期操作

dates = pd.date_range(start='1/1/2018', end='1/08/2018')
print(dates)

在这里插入图片描述

# 行索引
dates = pd.date_range(start='today', periods=6)#6天
# 数据
data_arr = np.random.randn(6, 4)
# 列索引
columns = ['A', 'B', 'C', 'D']
d4 = pd.DataFrame(data_arr, index=dates, columns=columns)
print(d4)

在这里插入图片描述
一维对象: 建立一个以2019年每一天作为索引, 值为随机数;

dates = pd.date_range(start='1/1/2019', end='12/31/2019', freq='D')
datas = np.random.randn(len(dates))
s1 = pd.Series(datas, index=dates)
print(s1[:10])

3. DataFrame的基本操作

1). 查看基础属性
narr = np.arange(8).reshape(2, 4)
d2 = pd.DataFrame(data=narr, index=['A', 'B'], columns&#
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我知道了。关于PandasDataFrame对象的使用,可以通过以下方式来创建: ```python import pandas as pd # 创建一个DataFrame对象 df = pd.DataFrame({ 'name': ['Tom', 'Jerry', 'Mickey'], 'age': [18, 20, 22], 'gender': ['M', 'M', 'M'] }) # 打印DataFrame对象 print(df) ``` 上述代码中,我们首先导入了Pandas库,并使用pd.DataFrame()函数创建了一个DataFrame对象。在创建时,我们传入了一个字典类型的数据,其中字典的键为列名,字典的值为该列的数据列表。最后,我们通过print()函数打印了该DataFrame对象。 除了创建DataFrame对象,我们还可以对其进行一些基本操作,例如获取某一列或多列的数据: ```python # 获取某一列的数据 name = df['name'] print(name) # 获取多列的数据 name_age = df[['name', 'age']] print(name_age) ``` 上述代码中,我们通过中括号[]来获取DataFrame对象中的某一列或多列数据,并将其赋值给一个变量。需要注意的是,当我们获取多列数据时,需要使用双重中括号[[]]。 除此之外,我们还可以对DataFrame对象进行一些统计计算,例如计算某一列的平均值、最大值、最小值等: ```python # 计算年龄列的平均值 age_mean = df['age'].mean() print(age_mean) # 计算年龄列的最大值 age_max = df['age'].max() print(age_max) # 计算年龄列的最小值 age_min = df['age'].min() print(age_min) ``` 上述代码中,我们通过调用DataFrame对象的mean()、max()、min()等方法,对其某一列数据进行了统计计算,并将结果赋值给一个变量。 这只是PandasDataFrame对象的一些基本用法,还有很多其他的操作和功能。如果你想深入了解,可以查看Pandas官方文档或相关书籍。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值