前四篇博客将Python科学计算库(Numpy)中的常用的一些函数讲了一下,下面开始讲解Python中的数据分析预处理库(Pandas)的一些常用函数,当然会分好几篇博客,请大家耐心看完。如果大家想要我代码所使用的数据集,(注:本文所使用的数据集为titanic_train.csv数据集)可以加QQ:920133676或者发邮箱920133676@qq.com。
(1)读取数据,输出结果为DataFrame格式,第一列表示索引号,并且最后将数据的行和列给出代码如下:
import pandas as pd
df = pd.read_csv('titanic_train.csv')
# 显示数据
print(df)
输出结果为:
PassengerId Survived Pclass ... Fare Cabin Embarked
0 1 0 3 ... 7.2500 NaN S
1 2 1 1 ... 71.2833 C85 C
2 3 1 3 ... 7.9250 NaN S
3 4 1 1 ... 53.1000 C123 S
4 5 0 3 ... 8.0500 NaN S
.. ... ... ... ... ... ... ...
886 887 0 2 ...