Python中的pandas库

最新推荐文章于 2024-07-17 09:53:25 发布

fenfenxhf

最新推荐文章于 2024-07-17 09:53:25 发布

阅读量5.9k

点赞数 1

分类专栏： Python3.6

本文链接：https://blog.csdn.net/fenfenxhf/article/details/82843778

版权

本文介绍了Python中pandas库的使用，包括打开.csv或.xlsx文件、打印行和列信息、数据筛选、运算、添加列、排序、处理缺失值、数据透视及定位等操作，还涉及了数据的统计分析和异常值处理。

摘要由CSDN通过智能技术生成

1.用pandas打开.csv或者.xlsx文件
.csv文件是以","作为分隔符的文件，可以用Excel打开（2003或者2007）

from pandas import *

fp = DataFrame(read_csv('food_info.csv')) #打开.csv文件
print(fp.head(1)) #打印数据的头1行，fp.tail(3) #打印数据的最后3行
print(fp.shape)

在这里插入图片描述

df = pd.DataFrame(pd.read_excel('name.xlsx')) #打开.文件xlsx

2.打印行信息

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))
print(fp.loc[0]) #打印第0行
print(fp.loc[0:3]) #打印0-3行,这和python不一样，python中[0:3]左包右不包
print(fp.loc[[2,5,6,8,9]]) #打印2,5,6,8,9行

3.打印列信息

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))
print(fp.columns.tolist()) #打印列名，并转化为列表形式
print(fp["NDB_No"]) #打印列名为NDB_No这一列
print(fp[["NDB_No","Water_(g)","Sugar_Tot_(g)"]])#打印列名为NDB_No,Water_(g),Sugar_Tot_(g)这3列

4.小练习：查找数据中列是以(g)为单位的

from pandas import *

fp = DataFrame(read_csv('food_info.csv'))

col_names = fp.columns.tolist()
print(col_names) #打印列名，并转化为列表形式

#查找哪些列单位是(g)为结尾
columns_g = [] #存储列名

f

最低0.47元/天解锁文章

fenfenxhf

关注

1
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
Python中的pandas库

1.用pandas打开.csv或者.xlsx文件.csv文件是以&quot;,&quot;作为分隔符的文件，可以用Excel打开（2003或者2007）from pandas import *fp = DataFrame(read_csv('food_info.csv')) #打开.csv文件print(fp.head(1)) #打印数据的头1行，fp.tail(3) #打印数据的最后3行print(fp...
复制链接

扫一扫

专栏目录