pandas&pandas学习教程&DataFrame与Series数据结构

最新推荐文章于 2024-05-28 17:32:20 发布

贰锤

最新推荐文章于 2024-05-28 17:32:20 发布

阅读量2.4k

点赞数 3

分类专栏： python学习笔记文章标签： pandas 数据结构

本文链接：https://blog.csdn.net/weixin_37895339/article/details/72857960

版权

安装：
pandas的最小依赖项为：
NumPy，python-dateutil，pytz
安装pandas前需先安装上述三个依赖项。
pandas官网文档强调，pandas项目名称中的字母应该全部采用小写形式，同时导入pandas库应采用import pandas as pd。
1.pandas的DataFrame数据结构
DataFrame是一种带标签的二维对象。
创建方式为：

从另一个DataFrame创建DataFrame
从具有二维形状的NumPy数组创建
用pandas的另一种数据结构Series创建
从CSV之类的文件创建

from pandas.io.parsers import read_csv
df = read_csv("hahaha.csv")    #从CSV中读取
print("Dataframe",df)   #显示内容
print(df.shape)        #数据结构的形状
print(len(df))          #长度
print(df.columns)       #每一列的标题     df.columns[2]
print(df.dtypes)        #每一列的数据类型   df.dtypes[2]
print(df.index)         #每一行的索引号
print(df.values)          #数据结构的值
print(df.values[4])       #通过索引检索每一行的值

DataFrame的索引可以由pandas自动创建，或是手动规定。
2.pandas的DataFrame数据结构
创建方式为：

由Python字典创建
由NumPy数组创建
由单个标量值创建

创建Series数据结构时，可以向构造函数递交一组轴标签，这些标签通常称为索引，是一个可选参数。通常，如果numpy作为输入数据，那么pandas将索引值从0开始自动递增。如果传递的为python字典，则键值为索引。如果输入的为标量值，则需手动提供索引值。

from pandas.io.parsers import read_csv
df = read_csv("WHO_first9cols.csv")    #从CSV中读取
first_col = df[df.columns[0]]   #选中DataFrame一列，则为Series型数据
print(first_col.dtypes)        #输出类型，numpy的函数同样适用于pandas
print(np.sum(first_col - first_col.values))   #numpy的函数适用于DataFrame与Series
print(first_col.shape)       #输出每维的长度
print(first_col.index)       #索引
print(first_col.values)      #值，索引方式first_col.valuse[4]
print(first_col.name)          #该列或者Series数据的名字，第一行

最低0.47元/天解锁文章

贰锤

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
pandas&pandas学习教程&DataFrame与Series数据结构

安装： pandas的最小依赖项为： NumPy，python-dateutil，pytz 安装pandas前需先安装上述三个依赖项。 pandas官网文档强调，pandas项目名称中的字母应该全部采用小写形式，同时导入pandas库应采用import pandas as pd。 1.pandas的DataFrame数据结构 DataFrame是一种带标签的二维对象。创建方式为：从
复制链接

扫一扫