pandas基本操作

最新推荐文章于 2024-02-04 11:05:13 发布

梦码城

最新推荐文章于 2024-02-04 11:05:13 发布

阅读量97

点赞数

分类专栏：数据处理与分析文章标签：数据结构列表 python numpy 机器学习

本文链接：https://blog.csdn.net/qq_45724216/article/details/119607008

版权

数据处理与分析专栏收录该内容

17 篇文章 0 订阅

订阅专栏

import pandas as pd
import numpy as np

# Numpy 和 Pandas 有什么不同
# 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的，没有数值标签，而 Pandas 就是字典形式。Pandas是基于Numpy构建的，让Numpy为中心的应用变得更加简单。
# 要使用pandas，首先需要了解他主要两个数据结构：Series和DataFrame。
# Series:Series的字符串表现形式为：索引在左边，值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1（N为长度）的整数型索引。
s = pd.Series([1, 3, 6, np.nan, 44, 1])
print(s)
# DataFrame:DataFrame是一个表格型的数据结构，它包含有一组有序的列，每列可以是不同的值类型（数值，字符串，布尔值等）。DataFrame既有行索引也有列索引， 它可以被看做由Series组成的大字典。
data = pd.date_range('20160101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=data, columns=['a', 'b', 'c', 'd'])
print(df)
# DataFrame简单使用
print(df['b'])
# 默认的从0开始 index
df1 = pd.DataFrame(np.arange(12).reshape((3, 4)))
print(df1)
df2 = pd.DataFrame({'A': 1,
                    'B': pd.Timestamp('20130102'),
                    'C': pd.Series(1, index=list(range(4)), dtype='float32'),
                    'D': np.array([3] * 4, dtype='int32'),
                    'E': pd.Categorical(['test', 'train', 'test', 'train']),
                    'F': 'foo'
                    })
print(df2)
print(df2.dtypes)  # 数据中的类型
print(df2.index)  # 对列的序号
print(df2.values)  # 看所有df2的值
# 想知道数据的总结, 可以用 describe():
print(df2.describe())
# 翻转数据
print(df2.transpose())
# 对数据的 index 进行排序并输出 ascending为True代表正序
print(df2.sort_index(axis=1,ascending=True))
# 对数据 值 排序输出
print(df2.sort_values(by='E'))

梦码城

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
pandas基本操作

import pandas as pdimport numpy as np# Numpy 和 Pandas 有什么不同# 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的，没有数值标签，而 Pandas 就是字典形式。Pandas是基于Numpy构建的，让Numpy为中心的应用变得更加简单。# 要使用pandas，首先需要了解他主要两个数据结构：Series和DataFrame。# Series:Series的字符串表现形式为：索引在左边，值在右边。由于我们没有
复制链接

扫一扫