pandas基本操作

import pandas as pd
import numpy as np

# Numpy 和 Pandas 有什么不同
# 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。
# 要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。
# Series:Series的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1(N为长度)的整数型索引。
s = pd.Series([1, 3, 6, np.nan, 44, 1])
print(s)
# DataFrame:DataFrame是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame既有行索引也有列索引, 它可以被看做由Series组成的大字典。
data = pd.date_range('20160101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=data, columns=['a', 'b', 'c', 'd'])
print(df)
# DataFrame简单使用
print(df['b'])
# 默认的从0开始 index
df1 = pd.DataFrame(np.arange(12).reshape((3, 4)))
print(df1)
df2 = pd.DataFrame({'A': 1,
                    'B': pd.Timestamp('20130102'),
                    'C': pd.Series(1, index=list(range(4)), dtype='float32'),
                    'D': np.array([3] * 4, dtype='int32'),
                    'E': pd.Categorical(['test', 'train', 'test', 'train']),
                    'F': 'foo'
                    })
print(df2)
print(df2.dtypes)  # 数据中的类型
print(df2.index)  # 对列的序号
print(df2.values)  # 看所有df2的值
# 想知道数据的总结, 可以用 describe():
print(df2.describe())
# 翻转数据
print(df2.transpose())
# 对数据的 index 进行排序并输出 ascending为True代表正序
print(df2.sort_index(axis=1,ascending=True))
# 对数据 值 排序输出
print(df2.sort_values(by='E'))
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦码城

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值