Pandas模块

最新推荐文章于 2022-09-29 09:30:00 发布

Allen__MB

最新推荐文章于 2022-09-29 09:30:00 发布

阅读量334

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/weixin_43690603/article/details/97416429

版权

Pandas是Python的数据处理模块，基于Numpy构建，主要数据结构为DataFrame。它支持读取数据、数据类型如object、int、float、datetime和bool，以及各种运算，包括加减乘除、最大值、最小值和平均值。Pandas还提供归一化操作、排序功能，并允许通过set_index()设定文本索引。DataFrame由多个Series组成，每个行或列都可视为一个Series。

摘要由CSDN通过智能技术生成

Pandas是Python中关于数据处理的模块

Pandas的底层是基于Numpy来实现的，它的核心数据结构是DataFrame

读数据、打印数据的基础信息、按行，列取数据

import pandas as pd

data = pd.read_csv("food_info.csv")#此处传入的是相对路径

print(type(data))#<class 'pandas.core.frame.DataFrame'>
print(data.head())#打印前五条（默认是前五条，可以指定打印前几行）
print(data.tail())#打印后五条（默认是后五条，可以指定打印后几行）
print(data.dtypes)#打印当前数据中有的数据结构（pandas中object就是str数据类型）

print(help(pd.read_csv))#查找read_csv函数的帮助

print(data.columns)#打印列名
col_names = data.columns.tolist()
print(col_names)#以列表形式打印列名

print(data.shape)#数据的形状（有多少行多少列）

print(data.loc[0:5])#location函数可以用来取出指定的行
a = [1, 2, 5]
print(data.loc[a])#可以以这种形式打印特定的列

print(data["NDB_No"])#按列取数据（read_csv函数如果不指定参数，默认将第一行定为列名）
col_name = "NDB_No"
print(data[col_name])#同样可以实现

取出所有以(g)结尾的数据列

import pandas as pd

data = pd.read_csv("food_info.csv")
col_names = data.columns.tolist()
print(col_names)
col_index = []
for name in col_names:
    if name.endswith("(g)"):
        col_index.append(name)
data_endwithg = data[col_index]
print(data_endwithg)

Pandas中的数据类型

object：str
int
float
datatime：时间值
bool：布尔值

Pandas中的运算

两列和某一列和数字之间的+ - * /都是对每一个数字进行操作

import pandas as pd

data = pd.read_csv("food_info.csv")

data_1 = data["Water_(g)"

最低0.47元/天解锁文章

Allen__MB

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Pandas模块

Pandas是Python中关于数据处理的模块Pandas的底层是基于Numpy来实现的，它的核心数据结构是DataFrame读数据
复制链接

扫一扫

专栏目录