Pandas入门——python

最新推荐文章于 2024-10-12 12:26:23 发布

一个业余

最新推荐文章于 2024-10-12 12:26:23 发布

阅读量132

点赞数

文章标签： python pandas 数据分析

本文链接：https://blog.csdn.net/qq_23055219/article/details/106593434

版权

这篇博客介绍了Python中Pandas库的基础使用，包括如何引用Pandas库以及DataFrame的数据结构，强调了DataFrame的行索引和列索引特性，并探讨了选择数据的方法。

摘要由CSDN通过智能技术生成

一、引用pandas库

import pandas as pd
data={'ID':['01','02','03'],
      'name':['王明','李春','刘华'],
      'gander':['男','女','女'],
      'age':[16,20,18],
      'height':[1.88,1.78,1.81]}
frame = pd.DataFrame(data)
print(frame)

> 输出：
——————>  column       axis=1
|  	 			ID    name   gander  age  height
|	   		0    01   王明      男   16    1.88
index		1    02   李春      女   20    1.78
			2    03   刘华      女   18    1.81
axis=0

DataFrame是一个表格型数据类型，既有行索引(index)，也有列索引(column)

二、选择数据

#选择行
print(frame[1:2])   #输出序号为1的行
#输出     ID name gander  age  height
#		1  02   李春      女   20    1.78
#注：frame[1] 是错误的
#  print(frame[0:2:2])    输出序号为 0 , 2 行

#选择列
print(frame['name'])
#输出    0     王明
#		1     李春
#		2     刘华
#选择多列   frame[['name','age']]   列表里只允许有一个值

#行列结合
print(frame['name'][1:2])  # 输出  1 李春
#['name'] 与 [1:2] 不分顺序

#使用loc函数，可以直接读取行、列和单元格   .loc[行, 列]
#行
print(frame.loc[1])  
#输出ID          02
#	name        李春
#	gander       女
#	age         20
#	height    1.78

#单元格
print(frame.loc[1, 'name'])  #中间用逗号隔开
# 输出 	      name
#  		     李春

#列
print(frame.loc[:, 'name'])
#输出    0     王明
#		1     李春
#		2     刘华

#使用iloc函数，它完全采用序号来访问行和列，比如 iloc[1,2] 表示第2行和第三列
print(frame.iloc[0:1, 2])
#输出   0    男
#		1    女

print(frame[[0,2], [0,1]])
#输出      ID name
#		0  01   王明
#		2  03   刘华

# 加条件
print(frame[frame['age'] > 17])
# 输出     ID name gander  age  height
#		1  02   李春      女   20    1.78
#		2  03   刘华      女   18    1.81

print(frame['name'][[1,2]][(frame['height'] > 1.80)])
#输出   2  刘华