Pandas----数据读取、查询(Python)
越整理,头脑越清晰。
读取数据之前需要导入pandas包
import pandas as pd
First
读取文件是进行数据分析的前提条件,所以我们先来看看如何读取文件,然后再进行下一步的操作。
#读取纯文本文档数据(csv,txt)
data = pd.read_csv("文件路径")
#读取表格数据
data = pd.read_excel("文件路径")
举个栗子
假设我们有一个文件,他的数据长这样:
我们的第一步操作就是去读取他(文件为excel表格):
Next
读取到的数据可以进行的一些基本操作:
#查看前几行数据
data.head()
#返回列数行数
data.shape
#查看列名列表(list)
data.columns
#查看索引列
data.index
#查看数据
data.values
让我们来康康,这些代码能得到什么结果:
(查看前几行数据默认五条,如果没记错的话。错了别怪我,自己试试看吧,哈哈哈哈哈哈哈哈哈嗝)
接下来还是查询:(其实我也不是很懂,索引需不需要引号,但是我觉得默认的索引是不需要的。)
#查询列值
data['列名']
#查询行值
data.loc[索引]
#查询数值
data.loc[索引,'列名']
data.loc[索引,['列名1','列名2']]
#查询列表
data.loc[[索引1,索引2],'列名']
data.loc[[索引1,索引2],['列名1','列名2']]
举个栗子更容易理解,来吧,朋友们:
(我们先打印data数据,再来进行理解。至于什么是series和dataframe,我们以后再了解吧。如果我继续写的话。)
好啦,今天的学习就到这里啦。如果有什么错的地方,欢迎大家来指导我,因为我也不是很懂,谢谢大家啦!!