python-Pandas_Study Record

2020-04-07

读取时抽取1%

import pandas as pd
import numpy as np

df = pd.read_csv("big_data.csv",  # 使用skiprows参数
skiprows = lambda x:x>0 and    # x>0保证首行选入
np.random.rand() > 0.01)

iloc/loc/ix区别
iloc:通过行/列号选取数据

# 取第一行
df.iloc[0]

# 选取多行数据
df.iloc[0:2]

# 选取第二列
df.iloc[:,[1]]

# 选取第0行第2列
df.iloc[0:1,[1]]

# 选取第0-2行第0-2列
df.iloc[0:2,[0,1]]

loc通过标签选取数据

# 按标签选取第b行
df1.loc['b']

# 按标签选取多行
df1.loc['b':]

# 按标签选取某列
df1.loc[:,['a']]

# 按标签选取多列
df1.loc[:,['a','b']]

# 按标签选取某行某列
df1.loc['a',['b','c']]

ix 简单粗暴 混合使用

# 通过行号选取
df.ix[1]

# 通过标签选取
df1.ix['a']

# 通过行号选取指定位置的数据
df1.ix[3,3]

# 通过标签选取指定位置的数据
df1.ix['a','a']

按照条件选取数据

# 通过单个条件选取数据
df1.loc[df1['a']==11]

# 通过多个条件选取数据
df1.loc[(df1['a']==11)&(df1['d']==1)]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值