Python中的pandas库

本文介绍了Python中pandas库的使用,包括打开.csv或.xlsx文件、打印行和列信息、数据筛选、运算、添加列、排序、处理缺失值、数据透视及定位等操作,还涉及了数据的统计分析和异常值处理。
摘要由CSDN通过智能技术生成

1.用pandas打开.csv或者.xlsx文件
.csv文件是以","作为分隔符的文件,可以用Excel打开(2003或者2007)

from pandas import *

fp = DataFrame(read_csv('food_info.csv')) #打开.csv文件
print(fp.head(1)) #打印数据的头1行,fp.tail(3) #打印数据的最后3行
print(fp.shape)

在这里插入图片描述

df = pd.DataFrame(pd.read_excel('name.xlsx')) #打开.文件xlsx

2.打印行信息

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))
print(fp.loc[0]) #打印第0行
print(fp.loc[0:3]) #打印0-3行,这和python不一样,python中[0:3]左包右不包
print(fp.loc[[2,5,6,8,9]]) #打印2,5,6,8,9行

3.打印列信息

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))
print(fp.columns.tolist()) #打印列名,并转化为列表形式
print(fp["NDB_No"]) #打印列名为NDB_No这一列
print(fp[["NDB_No","Water_(g)","Sugar_Tot_(g)"]])#打印列名为NDB_No,Water_(g),Sugar_Tot_(g)这3列

4.小练习:查找数据中列是以(g)为单位的

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))

col_names = fp.columns.tolist()
print(col_names) #打印列名,并转化为列表形式

#查找哪些列单位是(g)为结尾
columns_g = [] #存储列名

f
  • 1
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值