第二课堂AI实践笔记 pandas

数据载入

一、导入numpy与pandas

import numpy as np
import pandas as pd

注:若报错,返回conda环境中安装numpy与pandas

即在cmd进入conda环境输入

pip install numpy
pip install pandas

二、载入数据

df = pd.read_csv('./train.csv')

三、函数使用

groupby()
.groupby() 方法是用来对数据进行分组操作的。当你想要对数据集中的行进行分组,并且每组应用一些聚合操作,比如求和、平均值、最大值或最小值等,这个方法非常有用。

grouped = df.groupby(by=['column_name_1', 'column_name_2'])

unique(),nunique(),drop_duplicates()
三个唯一值函数,可以统计数据中的唯一值相关数据

replace(),where(),mask()三个替换函数

replace函数为映射替换

where 函数在传入条件为 False 的对应行进行替换

 mask 在传入条件为 True 的对应行进行替换,当不指定替换值时,替换为缺失值。这两个函数为逻辑替换

abs()等函数为数值替换,对数值进行修改。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值