Pandas模块

Pandas是Python的数据处理模块,基于Numpy构建,主要数据结构为DataFrame。它支持读取数据、数据类型如object、int、float、datetime和bool,以及各种运算,包括加减乘除、最大值、最小值和平均值。Pandas还提供归一化操作、排序功能,并允许通过set_index()设定文本索引。DataFrame由多个Series组成,每个行或列都可视为一个Series。
摘要由CSDN通过智能技术生成

Pandas是Python中关于数据处理的模块

Pandas的底层是基于Numpy来实现的,它的核心数据结构是DataFrame


读数据、打印数据的基础信息、按行,列取数据

import pandas as pd

data = pd.read_csv("food_info.csv")#此处传入的是相对路径

print(type(data))#<class 'pandas.core.frame.DataFrame'>
print(data.head())#打印前五条(默认是前五条,可以指定打印前几行)
print(data.tail())#打印后五条(默认是后五条,可以指定打印后几行)
print(data.dtypes)#打印当前数据中有的数据结构(pandas中object就是str数据类型)

print(help(pd.read_csv))#查找read_csv函数的帮助

print(data.columns)#打印列名
col_names = data.columns.tolist()
print(col_names)#以列表形式打印列名

print(data.shape)#数据的形状(有多少行多少列)

print(data.loc[0:5])#location函数可以用来取出指定的行
a = [1, 2, 5]
print(data.loc[a])#可以以这种形式打印特定的列

print(data["NDB_No"])#按列取数据(read_csv函数如果不指定参数,默认将第一行定为列名)
col_name = "NDB_No"
print(data[col_name])#同样可以实现

取出所有以(g)结尾的数据列

import pandas as pd

data = pd.read_csv("food_info.csv")
col_names = data.columns.tolist()
print(col_names)
col_index = []
for name in col_names:
    if name.endswith("(g)"):
        col_index.append(name)
data_endwithg = data[col_index]
print(data_endwithg)

Pandas中的数据类型

object:str
int
float
datatime:时间值
bool:布尔值


Pandas中的运算

两列和某一列和数字之间的+ - * /都是对每一个数字进行操作

import pandas as pd

data = pd.read_csv("food_info.csv")

data_1 = data["Water_(g)"
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值