今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习
接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要
Pandas库是在Numpy库上进行了封装,相当于高级Numpy库
在数据处理方面,运用Pandas库,也是非常多的,废话不多说
先说第一个函数,read_csv,读取CSV数据文件
import pandas
food = pandas.read_csv("food_info.csv")
print(type(food))
print(food.dtypes)
这里我打印了一下Type,可以看到类型为DataFrame,这个类型也是Pandas中,的核心类型
下面我打印了一下,dtypes。可以看到,下面也是在pandas中非常常用的几种类型。
int64,float64这两种就不用多说了。但是会发现一个新的类型。object类型
这个类型就相当于str类型,也就是字符串类型值。
然后接着,我们在运行一个函数
food.head()
这个函数的作用是,将我们数据中的,前5行打印出来。结果如下,
那么如果我们想让数据显示多条怎么处理呢?
food.head(8),只需要在这个函数中添加参数即可
可以显示前面的,那么肯定可以显示后面的,
food.tail(4)
这个方法相当于显示最后面的4条数据
如图所示,显示出最后的4行数据,可以看到跟数据中的数据做下对比,是一样的
那么如果获取到数据表中,每一列的列名指标呢?
print(food.columns)
使用这个方便,可以或得到每个列表示的列名,结果是一个list,如下图
还有一个要说的就是,如果看这个表的维度呢?我们直接在讲Numpy的时候讲过,如果查看矩阵的维度,用法一样,shape方法
print(food.shape)
可以看到如下结果,表示,当前数据,有8618 个样本,36个指标,36列
我们如何从pandas中获取到某个数据呢?使用如下方法
print(food.loc[0])
这里我们可以看到,我们将第一个样本的全部值取出来了。对比结果。
那么如果我们想去单独某条数据,那么只需要修改[0]到你需要的数据上即可。这里下标从0开始。
大小超过数据的样本集,会直接报错。
pandas中常用的数据类型如下
object 就是我们常说的字符串类型
int 整型
float 浮点型
bool 布尔型
今天就先讲到这里我,感谢大家的阅读,谢谢!!