python-pandas创建DataFrame类型

本文详细介绍了如何创建和操作Python Pandas DataFrame,包括通过列表、numpy对象和字典创建DataFrame,查看基础属性,数据查询,转置,排序,切片查询,值的更改,以及从文件中读写数据,特别是CSV和Excel文件。还深入讨论了groupby功能,用于数据的分组和聚合统计分析。
摘要由CSDN通过智能技术生成

1.创建DataFrame类型

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

方法1: 通过列表创建

li = [
    [1, 2, 3, 4],
    [2, 3, 4, 5]
]

# DataFRame对象里面包含两个索引, 行索引(0轴, axis=0), 列索引(1轴, axis=1)
d1 = pd.DataFrame(data=li, index=['A', 'B'], columns=['views', 'loves', 'comments', 'tranfers'])
print(d1)

在这里插入图片描述

方法2: 通过numpy对象创建

narr = np.arange(8).reshape(2, 4)
# DataFRame对象里面包含两个索引, 行索引(0轴, axis=0), 列索引(1轴, axis=1)
d2 = pd.DataFrame(data=narr, index=['A', 'B'], columns=['views', 'loves', 'comments', 'tranfers'])
print(d2)

在这里插入图片描述

方法3: 通过字典的方式创建;

dict = {
    'views': [1, 2, ],
    'loves': [2, 3, ],
    'comments': [3, 4, ]

}
d3 = pd.DataFrame(data=dict, index=['粉条', "粉丝"])
print(d3)

在这里插入图片描述
日期操作的特例:date_range()
源码:
在这里插入图片描述

dates = pd.date_range(start='1/1/2018', end='1/08/2018')
print(dates)

在这里插入图片描述

# 行索引
dates = pd.date_range(start='today', periods=6)
# 数据
data_arr = np.random.randn(6, 4)
# 列索引
columns = ['A', 'B', 'C', 'D']
d4 = pd.DataFrame(data_arr, index=dates, columns=columns)
print(d4)

在这里插入图片描述

练习:
一维对象: 建立一个以2019年每一天作为索引, 值为随机数;
因为是一维,所以用Series。

dates = pd.date_range(start='1/1/2019', end='12/31/2019', freq='D')
datas = np.ra
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值