Python数据分析处理库(Pandas)基础篇(IDE为Pycharm)- 数据预处理的常用函数

本文介绍Python数据分析库Pandas的基础知识,聚焦数据预处理的常用函数。通过实例展示了如何读取数据、操作DataFrame,包括获取特定列、设置索引等操作。文中提供titanic_train.csv数据集的获取方式。
摘要由CSDN通过智能技术生成

前四篇博客将Python科学计算库(Numpy)中的常用的一些函数讲了一下,下面开始讲解Python中的数据分析预处理库(Pandas)的一些常用函数,当然会分好几篇博客,请大家耐心看完。如果大家想要我代码所使用的数据集,(注:本文所使用的数据集为titanic_train.csv数据集)可以加QQ:920133676或者发邮箱920133676@qq.com。

        (1)读取数据,输出结果为DataFrame格式,第一列表示索引号,并且最后将数据的行和列给出代码如下:

import pandas as pd

df = pd.read_csv('titanic_train.csv')

# 显示数据
print(df)


输出结果为:
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0              1         0       3  ...   7.2500   NaN         S
1              2         1       1  ...  71.2833   C85         C
2              3         1       3  ...   7.9250   NaN         S
3              4         1       1  ...  53.1000  C123         S
4              5         0       3  ...   8.0500   NaN         S
..           ...       ...     ...  ...      ...   ...       ...
886          887         0       2  ...  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值